Offcanvas

AI / 개발자 / 비즈니스|경제 / 애플리케이션 / 오픈소스

CB인사이츠, '오픈소스 AI 개발 시장 지도' 발표

2023.11.13 김달훈  |  CIO KR
"AI 모델 개발에 대한 오픈소스 접근 방식이 주목을 받고 있다. 소스 코드를 공개적으로 사용할 수 있고, 개발자 커뮤니티가 소프트웨어 개선에 기여할 수 있도록 하는 데 초점을 맞추고 있기 때문이다. 그래서 기업이 AI 프로젝트를 구축하고 배포하는 데 도움이 되는 오픈소스 도구를 개발하는 70개의 회사를 15개 카테고리에 걸쳐 분류하고 이를 시장 지도로 정리했다."

CB인사이츠(CB Insights)가 '오픈소스 AI 개발 시장 지도(The open-source AI development market map)'를 발표했다. 오픈소스 AI 개발 지도는 오픈소스 형태로 AI 기반 모델과 도구를 비롯해 합성 교육 데이터 플랫폼, AI 배포 소프트웨어, AI 모델 모니터링 플랫폼 등을 제공하는 업체 등을 분야 별로 구분해 알기 쉽게 정리한 자료다.



오픈소스 AI 기업을 15개 범주로 구분해 정리한 오픈소스 AI 개발 시장 지도(위). 대규모 언어 모델 기반의 생성 AI, 생성 AI 이미지 모델 개발, AI 개발 플랫폼이 전체 투자 규모의 대부분을 차지하고 있다(아래). (자료 : CB Insights)

생성형 AI가 일상과 업무 속으로 빠르게 확산하면서, AI 전반에 관한 관심과 기대가 어느 때보다 높다. 이러한 가운데 AI를 구현하고 활용하는 과정에서 오픈소스 AI에 관한 논쟁이 뜨겁다. 오픈소스 AI를 지지하는 쪽은 대규모 개발자 커뮤니티를 통한 혁신과 AI 모델, 데이터, 코드 취약점의 투명성을 높이는 접근 방식의 능력을 강조한다. 반면, 강력한 생성형 AI가 사이버 공격 등에 악용될 것을 우려하는 목소리도 적지 않다.

그럼에도 많은 기업들이 오픈소스 기반으로 AI 도구와 플랫폼을 구축하고 있으며, 투자도 활발하게 이루어지고 있다. 대규모 언어 모델을 기반으로 한 생성 AI 개발 부문은 약 269억 달러의 투자를 유치했고, 그 뒤를 이어 이미지 모델 생성형 AI(142억 달러), AI 개발 플랫폼(93억 달러)이 많은 투자를 유치한 것으로 나타났다.

메타의 라마-2(Llama-2)는 오픈소스 AI 진영을 대표하는 대표적인 대규모 언어 모델이다. 반면, 생성형 AI 확산을 이끈 오픈AI(OpenAI)의 챗GPT나 구글의 바드(Bard)는 소스를 공개하지 않는 폐쇄적인 접근을 취하고 있다. 이러한 상황에서 CB인사이츠는 주요 오픈소스 AI 기업을 선별하고, 이를 다음과 같은 범주로 구분했다.

대규모 언어 모델 기반의 생성형 AI 개발은 기업이 콘텐츠 생성, 요약, 분류, 챗봇, 감정 분석 등과 같은 자연어 처리 애플리케이션을 구축할 수 있는 기반 모델과 API를 제공한다. 기업은 특정 사용 사례에 맞게 방대한 양의 텍스트에 대해 사전 학습된 대규모 언어 모델을 미세 조정하고 사용자 정의할 수 있다. 메타(Meta), 데이터 브릭스(Databricks) 모질라.에이아이(Mozilla.ai), 라이트온(LightOn) 등이 여기 속한다.

생성형 AI의 이미지 모델 개발은 시각적 콘텐츠를 제작하기 위한 기초 모델과 API를 제공한다. GAN(Generative Adversarial Network) 및 확산 모델과 같은 모델을 통해 사용자는 이미지 스타일, 콘텐츠, 표정 등의 출력 속성을 원하는 대로 조정할 수 있다. 이 분야 대표 기업으로는 엔비디아(NVIDIA), 데시(Deci), 스태빌리티 에이아이(Stability AI) 등이 있다.

AI 개발 플랫폼은 사내 AI 프로젝트를 개발하고 출시하려는 기업을 위한 원스톱 상점 역할을 하는 솔루션을 제공한다. 이 분야의 공급업체는 기업이 데이터 준비, 학습 및 검증부터 모델 배포 및 지속적인 모니터링에 이르기까지 AI 수명주기의 모든 측면을 단일 플랫폼을 통해 관리하여 엔드투엔드 모델 개발을 용이하게 할 수 있도록 지원한다. 관련 기업은 알레그로.에이아이(Allegro.ai), 도미노(Domino), 라이트닝(Lightning) AI, 에이치투오.에이아이(H20.ai) 등이 있다.

이울러 AI 알고리즘 훈련 시장에서 데이터 품질 관리를 지원하는 솔루션인 '머신러닝 훈련 데이터 큐레이션(Machine learning training data curation), AI 알고리즘 훈련을 위해 사실적인 비디오와 이미지를 제작하는 플랫폼을 제공하는 '합성 훈련 데이터 - 미디어(Synthetic training data — media)', 환자 건강 기록이나 고객 구매 내역처럼 데이터 세트의 주요 패턴을 식별하여 새로운 익명 데이터 세트를 생성하는 '합성 데이터 훈련 데이터 - 표 & 텍스트(Synthetic training data — tabular and text)'가 오픈소스 AI 생태계를 구성하고 있다.

이 밖에도 벡터 데이터 베이스(Vector databases), 기능 저장소 및 관리(Feature stores & management), 버전 관리 및 실험 추적(Version control & experiment tracking), 연합 학습 플랫폼(Federated learning platforms), 대규모 언어 모델 애플리케이션 개발(LLM application development), 알고리즘 감사 및 위험 관리(Algorithmic auditing & risk management), 모델 배포 및 제공(Model deployment & serving), 모델 검증 및 모니터링(Model validation & monitoring), 하드웨어-인식 AI 최적화(Hardware-aware AI optimization)가 오픈소스 AI 개발 분야를 이루고 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.