Offcanvas

AI / 비즈니스|경제 / 오픈소스

칼럼 | 상업용 LLM이 넘어야 할 3가지 큰 산

2023.11.30 Xun Wang  |  InfoWorld
LLM(Large Language Model)은 인간 언어를 이해하고 생성할 줄 안다. 이 생성형 AI 도구는 매우 강력하고 인기가 높아 소매업 및 전자상거래업 경영진의 90%가 업무 보조용으로 생성형 AI를 사용한다는 퓨처 커머스(Future Commerce)의 최근 보고서도 있다. 
 
ⓒ Getty Images Bank

예를 들어, LLM은 지속가능성이나 가격, 스타일에 각각 관심을 두는 고객 유형에 따라 다른 버전의 제품 설명을 생성할 수 있다. 이를 통해 전자상거래 기업은 고객 참여를 개인화할 수 있고 따라서 더 많은 매출을 거둘 수 있다. LLM 시장 규모는 2022년 105억 달러(약 13조 5,000억 원)로 추산되며, 많은 전문가가 오는 2029년까지 409억 달러(약 52조 7,000억 원) 규모에 달할 것으로 전망한다. 

그러나 기업이 LLM을 본격적으로 도입하기 전에 3가지 치명적인 장애물이 해결돼야 한다는 지적도 있다. 높은 LLM 개발 및 훈련 비용, 가격 투명성 결여, 오픈소스 LLM이 상업용 LLM에 미치는 영향이다. LLM을 둘러싼 과도한 기대는 현실이지만, 엄청난 현금을 보유한 기업만이 LLM을 운영할 수 있다. 심지어 초반에는 이런 기업마저도 손실을 볼 수도 있다.


1. 높은 개발 및 훈련 비용

기업은 재정적 한계로 인해 LLM 투자 정당화에 어려움을 겪고 있다. LLM 훈련에는 엄청난 데이터와 연산력이 필요한데, 이는 다른 운영 예산 중에서도 값비싼 품목이다. 가령 가장 인기 있는 LLM인 GPT-3도 오픈AI가 훈련시키는 데 460만 달러(약 59억 2,000만 원)가 들었다.

역사적으로는 LLM 배치와 훈련은 언제나 특화된 하드웨어와 소프트웨어를 요구하므로 값비싼 작업이었다. 기본적인 인하우스 배치도 5년간 6만 달러(약 7,700만 원)가량이 들어가지만, 일부 애플리케이션의 경우에는 확장성이나 성능이 충분하지 않을 수도 있다. 더 많이 확장할 수 있는 배치는 9만 5천 달러(약 1억 원)까지 비용이 올라간다. 여기에 더해 데이터 과학자와 지원 업무 담당 직원을 고용하고 적합한 실행 환경을 구축하며 시간이 지나는 동안 LLM을 계속 유지하는 데 들어가는 비용도 있다. 예상치 못한 장기적인 비용을 피하기 위해서는 이처럼 프로젝트의 전체 범위를 파악하고 승인해야 한다. 

오늘날에도 여전히 LLM 배치와 훈련에 드는 비용은 높지만 조금씩 합리적이고 접근 가능한 범위로 들어오고 있다. 간소화된 예산을 운용하는 소기업도 LLM에 접근하기 위해 고군분투하고 있는 와중에 오픈AI 같은 기업이 API를 SaaS 방식으로 제공함으로써 더욱 합리적이고 가까워졌다. 즉, 기업이 강력한 LLM을 사용하기 위해 자체적인 하드웨어와 소프트웨어를 구입하고 유지할 필요가 없다. 이제 기업은 서비스를 구독하고 온라인으로 API에 접근하면 된다.

훈련 비용도 이제는 그다지 비싸지 않다. 처음부터 훈련시키는 것이 아니라 미세 조정(find-tuning)하면 되기 때문이다. 미세 조정은 사전 훈련된 LLM을 자체 데이터로 추가 학습시키는 것으로, 완전히 바닥부터 훈련을 시작하는 것보다는 비용이 훨씬 저렴하다. 처음부터 전체 모델을 학습시키는 것이 아니라 새로운 데이터에 대한 학습만 필요하다. 이런 시나리오에서 LLM은 이미 기본 언어 패턴을 이해하고 있으므로 기업의 시간과 비용을 줄인다. 

높은 LLM 개발 및 훈련 비용은 중소기업에는 진입 장벽으로 작용해 왔다. 그 결과 자본을 쏟아부을 여력이 있는 대기업이 아닌 경우에는 LLM 도입이 느려지게 됐다. 그러나 LLM 배치와 훈련은 오픈AI 같은 기업과 미세 조정 같은 전략 덕분에 훨씬 저렴하고 접근 가능해졌다.


2. 가격 투명성 결여

가격 투명성 결여도 SMB가 LLM을 도입하는 데 장벽이 된다. 쿼리당 요금 지불하는 독립 소프트웨어 공급업체를 위한 현재의 가격 모델이나 최종 사용자를 위한 구독 시스템이 있더라도 마찬가지다. LLM 가격은 모델의 크기와 복잡성, 훈련에 드는 데이터, 제공하는 특정 기능 등 몇 가지 요소에 따라 변한다. 이런 점 때문에 SMB는 각기 다른 LLM 공급업체의 가격을 비교하고 가장 적합한 LLM을 선택하는 데 어려움을 겪는다. 

일부 LLM 공급업체는 가격을 미리 공개하지 않는 경우도 있기 때문에 계약 체결 전 정확한 LLM 예산을 파악하기도 어렵다. 쿼리당 지급 방식과 구독 모델로도 기업 경영진은 LLM이 여전히 엄두도 못 낼 만큼 비싸다고 생각할지 모른다. 예산 제약이 있는 소기업은 특히 그렇다.

SMB가 LLM 도입 시 직면할 수 있는 가격 관련 문제는 구체적으로 다음과 같다.
 
  • LLM 가격 이해의 어려움 : AI/ML 전문가가 없는 SMB는 LLM이 복잡하고 불투명하게 느낄 수 있고 가장 잘 맞는 모델을 선택하기 어렵게 만든다.
  • 숨은 비용 : 일부 LLM 공급업체는 설정, 유지, 노후화 지원 같은 숨은 요금을 청구하기도 한다.
  • 장기 계약 : 일부 LLM 공급업체는 장기 계약을 강요한다. 그러나 지속적인 LLM 사용을 감당할 수 없는 기업에는 장기 계약이 재정적으로 위험할 수 있다.

LLM 가격은 표준화되어 있지 않으며 예측할 수 없지만 한 가지는 확실하다. 매우 비싸다는 것이다. 현재 환경은 SMB에 있어 진입 장벽을 만들고 있고, 결과적으로 산업 전체의 혁신을 지연시킨다.


3. 오픈소스 LLM의 영향

라마 2(Llama 2)나 메가트론 튜링 NLG(Megatron-Turing NLG) 같은 오픈소스 LLM은 생성형 AI라는 강력한 기술에 대한 접근을 민주화하고 접근성을 높인다. 그러나 오픈소스 LLM의 성공이 LLM을 상업용화할 방도를 찾는 기업에는 실질적인 장벽이 될 수 있다.

오픈소스 LLM은 LLM 상업에 이중적 과제를 제시한다. 첫째, 오픈소스 LLM은 기업에 비용이 들지 않는 대안을 제시한다. 둘째, 오픈소스 LLM은 상업용 LLM 제품과 직접적으로 경쟁하는 새로운 애플리케이션과 서비스를 개발하는 산실 역할을 한다. AI 중심 챗봇, 번역 도구, 코드 생성 도구를 떠올려 보라.

오픈소스 소프트웨어는 다른 산업에서도 이미 성공을 증명했다. 오픈소스 운영체제 리눅스와 아파치 웹 서버가 각각의 시장에서 지배적인 업체가 된 것이 한 예다. 성장하는 개발자와 연구자 커뮤니티는 무서운 속도로 새로운 아이디어와 혁신을 만들어 내고 있다. 연산력에 대한 비용도 점진적으로 줄어들면서 LLM 활용 접근성을 낮추고 있다.

한 가지 경고 : 오픈소스 LLM은 표준화되어 있지 않아 필요에 맞는 적절한 LLM을 기업이 선택하거나 기존 시스템과 통합하기가 어렵다. 오픈소스 LLM이 일반적으로 이익 기업의 지원을 받지 못하기 때문에 기업은 사내 전문가를 고용하거나 지속적인 지원을 유지하기 위해 서드파티 업체와 협력해야 할 필요가 있다.


오픈소스 LLM의 약속

그럼에도 불구하고 오픈소스 LLM은 혁신과 경제적 성장을 촉진할 수 있다. 그러나 그 단계까지 도달하기까지는 시간이 걸릴 것이다. 커뮤니티 중심의 개발을 육성하고 핵심 윤리를 정립하고 개인정보 우려를 불식하기 위해서는 세심한 기획, 협업, 반복적인 정제가 필요하다. 기업은 이미 수많은 애플리케이션에 오픈소스 LLM을 사용하고 있다.
 
  • 24/7 지원과 고객 질문에 빠르고 정확하게 답변하는 고객 서비스 챗봇 
  • 개인화된 마케팅 문구를 생성하고 특정 고객에 더욱 효과적인 타깃 광고를 제공하는 마케팅 캠페인
  • 새로운 아이디어를 만들고 기존 제품을 개선하는 제품 디자인/개발 시스템
  •  코드 품질 개선과 작업 시간 절감에 도움이 되는 코드 생성기
  •  구매 경험을 강화하고 실적을 높이는 제품 추천 엔진

특히 SaaS API 솔루션으로 기업이 기존의 고비용 문제를 해결하는 데 도움을 준다는 점에서 상업용화된 LLM은 큰 가능성을 지니고 있다. 그러나 비용, 가격 투명성, 오픈소스 대안의 부상이라는 과제는 LLM 지형도에서 혁신과 접근성을 끌어올리려는 공통의 노력이 필요하다는 점을 계속 강조하고 있다.

*Xun Wang은 Bloomreach의 CTO다. 
editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.