2020.03.05

쿠버네티스용 머신러닝 툴킷 '쿠버플로우' 정식 버전 공개

Serdar Yegulalp | InfoWorld
데이터 과학자가 머신러닝 워크플로우를 손쉽게 관리, 배포, 확장할 수 있도록 지원하는 쿠버네티스용 머신러닝 툴킷의 정식 버전이 출시됐다. 

구글이 2017년 첫 공개했던 쿠버플로우의 1.0 버전이 정식 출시됐다. 쿠버플로우는 쿠버네티스 환경에서 머신러닝 워크플로우를 관리하고 배포할 수 있도록 돕는 솔루션이다. 
 
ⓒGetty Images

회사에 따르면 쿠버플로우는 머신러닝 프로젝트의 2가지 주요 문제를 해결하고자 개발됐다. 첫째, 통합된 엔드투엔드 워크플로우의 필요성이다. 둘째, 쉽고 직관적이며 확장이 간편한 배포의 필요성이다. 

쿠버플로우를 이용해 데이터 과학자는 쿠버네티스 상에서 머신러닝 워크플로우를 구축하는 것은 물론 쿠버네티스 혹은 그 내부구조를 알 필요 없이 머신러닝 모델을 배포, 관리, 확장할 수 있다.

쿠버플로우는 코드 작성부터 컨테이너 생성 및 할당, 모델 학습, 해당 모델의 서빙까지 머신러닝 프로젝트의 모든 모든 단계를 관리하도록 설계됐다. 또한 쿠버플로우 1.0은 데이터 분석을 위한 데이터 주피터 노트북(Jupyter notebooks)과 웹 기반 대시보드 UI 같은 도구들을 제공해 각 단계를 지원한다.

구글은 쿠버플로우가 모델 학습과 서빙뿐만 아니라 개발 및 연구 작업에서 반복성, 독립성, 확장성, 유연성을 제공한다고 강조했다. 쿠버플로우에서 실행되는 주피터 노트북은 리소스 제한적(resource-limited)인 동시에 프로세스 제한적(process-limited)이다. 또한 구성, 기밀 접근(access to secrets), 데이터 소스를 재사용할 수 있다고 회사 측은 전했다.

쿠버플로우에는 여러 컴포넌트가 있다. 파이프라인(Pipeline)은 파이선을 사용해 복잡한 머신러닝 워크플로우 작성을 자동화하는 컴포넌트다. 메타데이터(Metadata)는 개별 모델, 데이터세트, 모델 학습, 예측 실행에 대한 세부 정보를 추적해준다.

카티브(Katib)는 쿠버플로우의 하이퍼파라미터 튜닝 컴포넌트다. 코드 변환 없이 머신러닝 모델의 예측 정확도를 향상시킬 수 있는 자동화된 툴이다. 몇 가지 컴포넌트는 아직 개발 중이며, 조만간 출시될 예정이다. ciokr@idg.co.kr



2020.03.05

쿠버네티스용 머신러닝 툴킷 '쿠버플로우' 정식 버전 공개

Serdar Yegulalp | InfoWorld
데이터 과학자가 머신러닝 워크플로우를 손쉽게 관리, 배포, 확장할 수 있도록 지원하는 쿠버네티스용 머신러닝 툴킷의 정식 버전이 출시됐다. 

구글이 2017년 첫 공개했던 쿠버플로우의 1.0 버전이 정식 출시됐다. 쿠버플로우는 쿠버네티스 환경에서 머신러닝 워크플로우를 관리하고 배포할 수 있도록 돕는 솔루션이다. 
 
ⓒGetty Images

회사에 따르면 쿠버플로우는 머신러닝 프로젝트의 2가지 주요 문제를 해결하고자 개발됐다. 첫째, 통합된 엔드투엔드 워크플로우의 필요성이다. 둘째, 쉽고 직관적이며 확장이 간편한 배포의 필요성이다. 

쿠버플로우를 이용해 데이터 과학자는 쿠버네티스 상에서 머신러닝 워크플로우를 구축하는 것은 물론 쿠버네티스 혹은 그 내부구조를 알 필요 없이 머신러닝 모델을 배포, 관리, 확장할 수 있다.

쿠버플로우는 코드 작성부터 컨테이너 생성 및 할당, 모델 학습, 해당 모델의 서빙까지 머신러닝 프로젝트의 모든 모든 단계를 관리하도록 설계됐다. 또한 쿠버플로우 1.0은 데이터 분석을 위한 데이터 주피터 노트북(Jupyter notebooks)과 웹 기반 대시보드 UI 같은 도구들을 제공해 각 단계를 지원한다.

구글은 쿠버플로우가 모델 학습과 서빙뿐만 아니라 개발 및 연구 작업에서 반복성, 독립성, 확장성, 유연성을 제공한다고 강조했다. 쿠버플로우에서 실행되는 주피터 노트북은 리소스 제한적(resource-limited)인 동시에 프로세스 제한적(process-limited)이다. 또한 구성, 기밀 접근(access to secrets), 데이터 소스를 재사용할 수 있다고 회사 측은 전했다.

쿠버플로우에는 여러 컴포넌트가 있다. 파이프라인(Pipeline)은 파이선을 사용해 복잡한 머신러닝 워크플로우 작성을 자동화하는 컴포넌트다. 메타데이터(Metadata)는 개별 모델, 데이터세트, 모델 학습, 예측 실행에 대한 세부 정보를 추적해준다.

카티브(Katib)는 쿠버플로우의 하이퍼파라미터 튜닝 컴포넌트다. 코드 변환 없이 머신러닝 모델의 예측 정확도를 향상시킬 수 있는 자동화된 툴이다. 몇 가지 컴포넌트는 아직 개발 중이며, 조만간 출시될 예정이다. ciokr@idg.co.kr

X