Offcanvas

디지털 트랜스포메이션 / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스

칼럼ㅣAI 프로젝트 악순환 고리 끊어라··· 'ML옵스' 마인드셋이 필요한 이유

2021.07.26 Yash Mehta  |  CIO
커뮤니케이션 격차(communications gap)로 인해 프로덕션 단계에 도달하지 못하는 AI 프로젝트가 부지기수다. 

AI 프로젝트를 아이디어에서 현실로 옮기는 것은 악순환이다. 이를 해결하는 방법은 한 가지뿐이다. 애초에 순환을 시작하지 않는 것이다.데이터는 모든 단계에서 전문적인 처리를 거쳐야 하기 때문이다.

다양한 소스에서 데이터를 추출하는 것부터 시작해 데이터 정리, 분석, 채우기까지 기존 아키텍처에 ‘ML옵스(MLOps)’, 즉 머신러닝에 관한 운영적 접근법이 없다면 머신러닝 시스템은 지연되기 쉽다. 
 
ⓒGetty Images

대부분의 AI 프로젝트가 프로덕션 단계까지 가지 못하는 이유는 매우 기본적인 것처럼 보이지만 큰 영향을 미치는 격차 때문이다. 바로 데이터 과학자와 비즈니스 간 부적절한 커뮤니케이션이다. 

IDC에서 진행한 설문조사 결과도 데이터 과학자와 비즈니스 간 지속적인 인게이지먼트가 중요하다고 말한다. 따라서 기업들은 즉시 사용할 수 있는 솔루션을 찾게 됐고, 바로 여기에서 ML옵스가 등장한다. 

ML옵스 전략은 다음에 중점을 둔다.

• 신속한 처리를 위해 데이터 추출, 모델 생성, 배포 및 모니터링에 엔드투엔드 가시성 제공
• 버전 관리 데이터 및 메타데이터 등 관련 아티팩트를 모두 저장해 프로덕션 모델의 감사 및 복제 시간 단축
• 변화하는 환경 및 요건에 따른 손쉬운 모델 재학습
• 빠르고 안전하며 정확한 ML 시스템 테스트


하지만 ML 모델을 개발, 구축 또는 학습시키는 것은 주요한 병목 요인이 아니다. 프로덕션 환경에서 큰 중단 없이 지속적인 운영을 위한 통합 AI 시스템을 구축하는 것이 실질적인 과제다. 

예를 들면 ML 솔루션을 온디맨드 방식으로 배포해야 하는 조직은 실험 코드를 반복적으로 다시 작성할 수밖에 없다. 이 접근법은 애매해서 성공으로 끝날 수도 있고 그렇지 않을 수도 있다. 이게 바로 ML옵스가 해결하려고 하는 것이다. 

간단히 말해, ML 모델용 데이터옵스(DataOps)가 ML옵스다. 이는 속도 및 견고성을 달성하고자 데이터 과학자와의 협업을 통해 ML 모델을 운영하는 프로세스다. 

ML옵스 전략화에 적절한 서비스 모델을 제공하는 ‘뉴로메이션(Neuromation)’은 견고한 ML 라이프사이클 관리를 달성하기 위해서는 데이터 과학자와 엔지니어의 협력이 중요하다고 강조했다.  

이러한 협력에는 데이터 과학자뿐만 아니라 엔지니어, 클라우드 아키텍트 및 모든 이해관계자의 지속적인 피드백이 포함된다. 그 과정에서 프로덕션 환경에 적합한 ML 모델이 구축되며, 데이터 중심의 데브옵스 사례가 만들어진다.  

이 밖에 더 해야 할 일은 다음과 같다.

CI/CD 파이프라인 자동화
CI/CD는 ML 파이프라인의 구축, 테스트, 배포를 자동화한다. 이는 또한 새롭게 설계된 모델 아키텍처, 기능, 하이퍼파라미터를 사용하여 새로운 지속적인 ML 파이프라인을 배포한다. 이렇게 배포된 파이프라인은 새로운 데이터 세트에서 추가로 실행된다. 

새로운 데이터가 제공되면 지속적인 자동화 파이프라인은 새로운 예측 서비스를 구축한다. 이때 출력이 새 구성요소의 소스코드가 된다. 이는 의도된 환경의 새 소스 리포지토리에 추가로 푸시된다. 

새로운 소스코드는 CI/CD 파이프라인을 트리거해 새 구성요소를 빌드한 후 지속적인 유닛 및 통합 테스트를 수행한다. 모든 테스트가 통과되면 새로운 파이프라인이 대상 환경에 배포된다. 이 파이프라인은 미리 정해진 일정과 학습 데이터에 따라 프로덕션 환경에서 자동으로 실행된다. 

간편한 데이터 평가를 위한 레이크 구축
ML은 방대한 양의 데이터 처리에 적합하다. 따라서 즉각적인 예측에 이를 고려하기 앞서 적절한 양과 효율성을 보장하기 위해 데이터 타당성이 필요하다. 

예를 들어 수백만 명의 고객 데이터를 처리하는 QSR(Quick Service Restaurant) 시스템은 이를 지원할 ML을 필요로 한다. 데이터가 지속적으로 증가할 뿐만 아니라 민첩성 측면에서 요건 및 상황도 변화하기 때문이다. 라스트 마일 배송, CRM, 인하우스 EPR 등과 같은 수많은 시스템이 연계돼 있는 전자상거래 환경도 마찬가지다. 

먼저 모든 데이터 소스에 원활하게 액세스할 수 있는 데이터 레이크 환경을 설정해야 한다. 중앙집중식 웨어하우스처럼 데이터 레이크는 데이터 평가의 핵심이 돼야 한다. 

또한 이는 ML옵스 프로세싱 및 데이터 애널리틱스 환경에 관한 데이터를 필터링하고 검증하는 리포지토리다. 데이터가 정성적 애널리틱스와 필요한 비즈니스 변화를 구축하기에 충분한 가치를 가지고 있는지 확인하려면 지속적인 실험을 해야 한다. 이를 위해 사용할 수 있는 데이터 세트를 빠르게 처리하는 확장 가능한 컴퓨팅 환경을 써야 한다. 

동시에 레이크에는 고급 시각화를 위한 인터랙티브 대시보드가 필요하다. 데이터 시각화 대시보드의 예로 AWS 퀵 사이트(AWS Quick Sight), 플로틀리 대시(Plotly Dash), 파워 BI(Power BI) 등을 들 수 있다. 이러한 대시보드는 변화하는 비즈니스 요구사항에 맞춰 쉽게 커스텀할 수 있다. 

데이터 평가가 끝나면 나중에 사용할 수 있도록 모든 데이터 세트가 필터링되고 구조화된다. 이 단계에는 카탈로그 작성도 포함된다. 데이터 카탈로그는 소스부터 마이크로서비스를 소비하기까지 메타데이터의 구조와 계보를 발견하고 시각화하는 데 필요하다. 

예측 서비스 및 성능 모니터링 
학습, 데이터, 모델 유형 외에도 비즈니스 목표를 기준으로 (구축된) 모델의 성능을 판단하는 다른 지표가 있다. 머신러닝 모델의 최적 출력을 측정하려면 다음 지표를 고려해야 한다.

- 지연(Latency): 끊김 없는 사용자 경험(UX) 평가. 지연 시간을 밀리초 단위로 측정.
- 확장성(Scalability): 특정 지연 동안 서비스 트래픽을 처리하는 기능. 초당 쿼리수(QPS; Queries-per-second)로 측정된다.
- 서비스 업데이트(Service Update): 업데이트하는 동안 서비스 중단 시간을 최소화한다. 


데이터 패브릭 사용
‘데이터 패브릭(data fabric)’은 다양한 소스에서 데이터를 수집하고 이를 애널리틱스 담당이 비즈니스에 사용할 수 있는 상태로 만들기 위한 프레임워크다. ML옵스 이니셔티브는 클라우드 및 온프레미스의 다양한 운영 사례에서 데이터 패브릭과 긴밀하게 연동된다. 

패브릭은 중앙집중식 조정 흐름을 만들기 때문에 위험을 완화하고 전체적인 빅 데이터 관리 비용을 줄여준다. 흥미롭게도, 기업들은 데이터옵스 이니셔티브를 확장하기 위한 기반으로 패브릭을 사용해 왔다. 

예를 들면 ‘케이투뷰(K2View)’는 패브릭 기술을 바탕으로 구축된 데이터 프렙 허브를 제공한다. 데이터 프렙 허브는 재정의된 스키마 및 규칙에 따라 다양한 소스에서 데이터를 캡처, 필터링, 강화, 마스팅한다. 

여기서 데이터가 전용 마이크로DB에 저장된 디지털 엔티티(Digital Entity)는 모든 고객을 나타낸다. 이러한 비즈니스 엔티티의 데이터 파이프라인 접근법은 무결성을 보장해 팀에 중단 없는 액세스를 제공한다. 

보너스 팁: 적절한 클라우드 아키텍처 선택
데이터 환경은 어떤 식으로든 클라우드 애플리케이션과 연결돼 있을 가능성이 크다. 점점 더 많은 클라우드 모델이 기업에 포함됨에 따라 다음의 기본사항을 확인해야 한다. 클라우드 플랫폼이 ML옵스에 적합한가? 

대부분의 클라우드 플랫폼은 내장된 데이터 과학 기능을 제공하긴 하지만 엔드투엔드 ML 파이프라인(스토리지, 수집, 모델링, 시각화, 모니터링 등)에 있어 탄력적이고 고성능인 프로세싱을 지원하는지 확인해야 한다. 

여기서 코드형 인프라(Infrastructure-as-Code; IaC)는 확장 가능하고 재현 가능한 ML 환경의 프로비저닝을 자동화한다. 온프레미스와 마찬가지로 클라우드 플랫폼은 정확한 ML 모델 학습과 테스트를 위해 CI/CD를 활용한다. 

ML옵스를 지원하는 클라우드의 예로는 AWS 세이지메이커(AWS SageMaker), 구글 클라우드 AI 파이프라인(Google Cloud AI Pipelines), 데이터브릭(Databricks) 등이 있다. 

-> ‘ML옵스 분야 이끈다’ 알아둘 만한 AI 스타트업 5곳
-> 도미노피자의 데이터 과학 비밀 재료는... 'ML옵스'
-> 머신러닝 운영과 관리, 'ML옵스'가 뜬다

결론
ML옵스 전략에 관해 고려해야 할 주요 지표를 살펴봤다. 자동화는 주류 서비스이기 때문에 기업들의 다음 과제는 ‘X옵스(XOps)’ 기술의 수준을 높이는 것이다. ML옵스를 사용하면 데이터옵스 프로세스에 대한 인게이지먼트를 높일 수 있을 뿐만 아니라 (계속 변화하는) 고객의 기대도 충족시킬 수 있다. 

* Yash Mehta는 IoT(Internet of Things), M2M(machine to machine) 커뮤니케이션, 빅 데이터 기술 전문가다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.