Offcanvas

AI / BI / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스 / 오픈소스

데이터브릭스, 생성형 AI 업체 ‘모자익ML’ 1조원에 인수

2023.06.27 Anirban Ghoshal  |  InfoWorld
데이터브릭스가 생성형 AI 기업 모자익ML(MosaicML)를 인수해 레이크하우스 플랫폼에 AI 모델 학습 기능을 강화한다고 밝혔다. 
 
ⓒ MosaicML

데이터 레이크하우스 전문 업체인 데이터브릭스(Databricks)가 생성형 AI 기능을 강화하기 위해 대규모 언어 모델(LLM) 및 모델 훈련 소프트웨어 업체인 모자익ML을 13억 달러(약 1조 6,900억 원)에 인수한다고 26일 발표했다.

최근 오픈소스 기반 대형언어모델(Large Language Models, LLM) ‘돌리(Dolly)’를 공개한 데이터브릭스는 생성형 AI 애플리케이션을 개발할 수 있도록 레이크하우스 플랫폼에 모자익ML의 기술을 결합해 모델, 훈련 및 추론 기능을 추가할 예정이다.
 
돌리는 상업적 이용에 제약이 있는 챗GPT 같은 폐쇄형 학습 모델과 달리 개방형 데이터 세트를 기반으로 개발됐다. 모자익ML의 모델인 MPT-7B와 최근 출시된 MPT-30B도 오픈 소스 기반 기술이다. 데이터브릭스는 오픈소스 기반 LLM 기술을 갖춘 모자익ML을 활용해 오픈 소스 LLM 전략을 더욱 강화할 것으로 보인다. 
 
모자익ML에 따르면, 모자익ML의 모델은 사람의 개입이 전혀 없이 훈련 시스템을 자동화할 수 있다는 장점이 있다고 한다. 모자익ML은 공식 블로그를 통해 “모자익ML은 처음부터 끝까지 사람의 개입 없이 MPT-7B를 훈련했다. 440개의 GPU로 9.5일 동안 4건의 하드웨어 오류를 감지 및 해결하고 자동으로 훈련 실행을 재개했다. 아키텍처 및 최적화 기술이 개선되면서 치명적인 손실이 급증하는 경우는 없었다”라고 설명했다.

이번 인수 건으로 공동 설립자 겸 CEO인 나빈 라오(Naveen Rao)를 포함한 모자익ML 직원 60여 명은 데이터브릭스로 합류해 AI 모델을 개발할 예정이다.

모자익ML 기존 고객에는 앨런 AI 연구소(Allen Institute for AI), 제너럴 인텔리전트(Generally Intelligent), 히포크라틱 AI(Hippocratic AI), 리플릿(Replit), 스캐터랩(Scatter Lab) 등이 있다. 모자이크ML의 기존 고객은 계속 모자익ML의 LLM 및 추론 제품을 이용할 수 있다. 

2021년 미국 샌프란시스코에서 설립된 모자익ML은 럭스 캐피털(Lux Capital), DCVC, 퓨처 벤처스(Future Ventures), 매버릭 벤처스(Maverick Ventures), 플레이그라운드(Playground) 등으로부터 투자를 받았으며, 지금까지 유치한 투자 금액은 6,400만 달러(약 835억 원)다.

13억 달러를 인수 금액으로 제시한 데이터브릭스는 이번 계약에서 모자익ML 직원의 고용을 유지하는 조항이 있었다고 밝혔다. 

데이터브릭스는 지난 5월 AI에 특화된 데이터 거버넌스 플랫폼 오케라(Okera)를 인수했으며, 인수 조건 및 금액은 따로 공개하지 않았다. 데이버브릭스의 대표 경쟁 기업인 스노우플레이크 역시 최근 미국의 AI 스타트업 니바(Neeva)를 인수한 것을 고려하면, 데이터 플랫폼 업체의 기술력 확보를 위한 노력은 더욱 늘어날 것으로 전망된다. 
ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.