Offcanvas

AI / 비즈니스|경제

최형광 칼럼 | 생성형 AI의 MBTI는 ISTP다

2024.02.21 최형광  |  CIO KR
MBTI는 융의 분석심리학 모델에서 개발된 성격 유형 검사로, 16가지의 유형으로 사람의 성격을 설명하며 적합한 직무를 찾기 위한 목적으로 개발됐다. ISTP는 모든 MBTI 유형 중 오지랖이 가장 적은 유형이며, 맹목적이고 감정적인 것을 싫어하는 특성을 지닌다고 한다. 또한 “가능한 한 에너지 소비를 하지 않으려 하며, 사실적 자료를 정리, 조직하기를 좋아하는 경향이 있으며 인과관계나 객관적 원리에 관심이 많고, 말수가 적으며, 객관적이고 합리적으로 인생을 관찰하는 유형”이라고 나무위키는 설명한다. 

생성형 인공지능의 MBTI는 ISTP다
폭발적인 성장을 보이는 생성형 AI 시장의 특징은 ISTP다. ISTP는 ‘Innovative Startup Transformer Platform’, 즉 혁신 스타트업의 트랜스포머 플랫폼이다. 2023년 6월에 창업한 프랑스의 미스트랄 AI 사는 6개월 만인 2023년 12월에 오픈소스의 생성형 AI를 선보이며 허깅페이스 리더보드 중 톱10에 진입하며 프랑스 국민기업으로 주목받았다. 미스트랄 AI를 창업한 3명의 설립자는 구글 딥마인드와 메타 AI 연구원 출신들로 오픈소스 기반의 솔루션을 지향하며 대안적이고 혁신적인 프로젝트를 구현하고 있다.

생성형 인공지능 시장은 대규모 언어모델(LLM)과 데이터를 기반으로 한 빅테크인 오픈 AI, 구글의 영역으로 인식되었다. 그러나 미스트랄 AI 솔루션이 순위권에 진입함에 따라, 그 동안 조용했던 유럽(EU) 지역에서 프랑스가 두드러지게 됐다. 미스트랄 AI는 영어 외에도 프랑스어, 독일어, 스페인어, 이탈리아어를 마스터하는 등 다국어 모델에 능숙하게 작동하도록 미세 조정(Fine Tuning)됨에 따라 특히 돋보이는 오픈소스 모델로 부상했다. 

그 동안 빅테크 기업들이 생성형 AI 구현을 주도한 데에는 모델의 파라미터가 많을수록 성능이 좋아지는 ‘Scaling Law’가 있었다. 미스트랄은 GPT-4와 유사한 전문가 혼합(MoE, Mixture of Expert) 아키텍처를 사용한다. MoE 방법은 수학, 물리, 언어 등 각 모듈의 작은 전문 모델로 분리하고 상황에 맞추어 혼합하는 방식으로 구현할 수 있다. 미스트랄은 MoE 아키텍처를 가진 인공지능 모델로 사이즈도 작지만 강력한 성능을 갖춘 소형GPT-4 같은 생성형 AI다.


[그림1] LLM 리더보드 순위와 미스트랄AI 와 라마2 모델 비교

신생 스타트업인 미스트랄 AI의 성능을 메타의 라마2(LLaMA2)와 비교한 결과는 [그림1]의 오른쪽에서 볼 수 있다. 미스트랄 AI는 70억 개의 매개변수를 사용하는데 비해 340억 개 또는 130억 개의 매개변수를 사용하는 라마2의 성능을 거의 모든 부분에서 능가한다. 모델이 적어도 데이터가 많고 미세조정을 잘 하면 더 좋은 결과를 만들 수 있음을 보여주는 사례다. [그림1]의 상위권에 있는 대부분의 거대 언어모델이 상용화를 추구하며 라이선스를 오픈하지 않고 있는 반면, 미스트랄 AI는 오픈소스 아파치2.0에 기반한다. 덕분에 많은 스타트업에서 기반 모델로 응용하고 있으며 그 결과 성능 좋은 우수한 새로운 모델이 시장에 나타나고 있다.

한국의 솔라(Solar)와 프랑스의 미스트랄, 1위 달성
한국의 인공지능 스타트업 기업인 업스테이지는 발표한 LLM 기반의 솔라(Solar)가 최근 세계 개방형 AI 성능 순위인 머신러닝 플랫폼 '허깅페이스 거대언어모델 평가'에서 1위에 올랐다. 그 후 솔라를 튜닝한 대부분의 모델들이 톱 순위에 이름을 올리기도 했다. 솔라의 모델 또한 대규모 컴퓨팅을 사용하지 않고도 뛰어난 성능을 보이며, 독자적이며 독보적인 결과를 만들었다는 점에서 눈길을 끈다.

업스테이지(UpStage)는 네이버 출신의 개발자 3명이 2020년에 설립한 스타트업으로 보통 수천 억 개 심지어 조 단위의 파라미터를 사용하는 생성형 AI 업계에서 107억 개(10.7B)의 매개변수를 사용하며 적은 컴퓨팅 자원으로 우수한 결과를 구현했다. 업스테이지의 솔라는 2위를 차지한 알리바바 최신모델 퀜(Qwen)의 720억 매개변수와 비교해 약 1/7 정도의 크기로 더 좋은 성능을 보여줬다. [그림2]의 오른쪽 리더보드 순위에서 솔라는 74.2점으로 1위, 알리바바의 퀜은 73.6점으로 2위에 올랐다.


[그림2] PoE에 올라온 솔라(Solar-Mini)와 개방형 언어모델 1위를 기록한 솔라. PoE에는 글로벌 빅테크의 모델이 포진해 있고 솔라(Solar)가 공동 모델로 함께하고 있다.

솔라는 유니콘 기업으로 등극한 미스트랄 AI의 최신 모델 믹스트랄(Mixtral 8x7B)의 성능(72.62점)을 넘어섰고, 글로벌 인공지능 회사의 여러 모델이 성능을 압도했다. 라마2를 미세조정하여 성능을 구현한 솔라는 상용화가 가능한 '아파치 2.0' 라이선스로 공개된 상태이며, 지금까지 이뤄진 솔라의 다운로드 수는 1만 건을 상회한다. 또한 국내의 스타트업 트웰브랩스도 지난해 엔비디아와 인텔에서 130억원(1,000만 달러) 투자를 유치한 바 있다. 이 기업의 솔루션은 텍스트를 입력하면 영상을 만드는 영상언어모델 페가수스다. AI 산업에서 여러 스타트업이 도약하고 있는 셈이다.

ISTP, Innovative Startup Transformer Platform
생성형 AI 시장을 개척한 오픈 AI는 월 사용료 20불의 상용화 시장을 지향하며 비공개로 전환하고 있다. 솔라와 미스트랄과 같은 많은 회사들이 오픈소스 솔루션으로 뛰어난 성능을 구현 중이다. 반도체 전쟁으로 메모리와 GPU 컴퓨팅 자원 확보가 어려운 중국의 인공지능 스타트업 ’0.1AI’도 창업 7개월 만에 340억개의 매개변수를 사용하는 오픈소스 LLM ‘Yi-34B’를 출시하여 지난해 LLM 리더보드에서 1위를 기록한 바 있다. 인도와 UAE에서도 여러 신모델이 나오고 있다.

현재 글로벌 생성형 AI 활용 플랫폼 ‘Poe.com’(Platform for Open Exploration)에서 여러가지 언어 모델을 사용할 수 있으며, 나만의 챗봇을 만들 수 있다. Poe에는 오픈AI의 GPT4.0 뿐만 아니라 구글팜, 메타의 라마, 엔트로픽 클로드과 함께 솔라 모델이 공식으로 등록됐다. 접속하면 다양한 모델과 비교하면서 사용할 수 있다. 솔라(Solar, Specialized and Optimized LLM and Applications with Reliability)는 이름과 같이 ‘신뢰성을 갖춘 전문화되고 최적화된 거대언어모델 애플리케이션’으로 기업의 최적화된 프라이빗 인공지능 LLM을 지향하며 새로운 기업 인공지능시장을 개척하고 있다.

생성형 AI의 MBTI는 ISTP(Innovative Startup Transformer Platform)로, 혁신적 스타트업 트랜스포머 플랫폼을 지향한다. 각국의 인공지능 스타트업은 글로벌 빅테크기업의 자본과 성능을 오픈소스 혁신기술로 극복하며 경쟁 중이다. 바야흐로 새로운 생성형 AI 시장이 열리고 있다.

* 최형광 교수(hk.choi@ssu.ac.kr)는 숭실대학교 일반대학원 AI·SW융합학과에서 학생들을 지도하고 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.