정보와 지식은 사회의 변화, 난해한 문제 해결, 새로운 세상을 이끄는 힘이다. 정보기술은 정보와 지식을 공유하는 인프라다. 우리는 페이스북의 ‘좋아요’를 통해 정보와 감정을 전파하고 공유하며 댓글을 통해 의견과 감정을 전달한다. 지식은 경험과 교육에서만 나오는 것이 아니다. 위키피디아와 인터넷으로 24시간 검색되고 공유되며, 다양한 소셜미디어의 알림을 통하여 확장되고 업데이트 된다.
구텐베르크와 지식의 대량복제
인쇄는 납활자로 저자의 생각을 대량 복제한다. 인류 역사에서 책을 만드는 작업은 많은 비용과 노동을 요구했었다. 구텐베르크는 인쇄술로 대량 출판을 열었다. 1440년대 이후 책 한권을 만드는 노력은 몇 달에서 몇시간으로 단축되었다. 구텐베르크가 인쇄한 성경책은 필사본 생산속도 대비 15배 빨랐다. 가격은 30굴덴(금화 단위)으로 필경사가 만든 성경책의 100굴덴과 비교해 1/3 이하에 불과했다.다. 인쇄의 출현으로 필경사(필사공) 직업이 사라지게 되었다.
일반인들도 독서를 시작하면서 새로운 출판시장이 생성되었고 누구나 값싸게 책을 이용할 수 있는 정보의 대량 복제와 공유의 시대가 시작됐다. 책을 통하여 출현한 새로운 지식 계층은 시민사회를 만들었다. 종교적 및 세속적 권위가 분산되었고, 지식의 재분배를 통한 사회구조의 변화로 확장됐다. 인류의 역사 이후 필사로 만들어진 책보다 인쇄술 후의 30년 ~ 40년 동안 만들어진 책이 더 많았다.
그렇다면 지금은 어떤가? 책 한권 또는 영화 한편은 복사와 붙이기(컨트롤c와 v)를 통하여 몇 초를 소요할 뿐이다. 물론 종이책이 아닌 디지털 파일이다.
[그림]은 구텐베르크의 인쇄술이 만든 정보의 변화를 보여주고 있다. 비교한 대상은 AI 파운데이션 모델(AI 기반 모델)이다. 현재 챗GPT로 시작한 인공지능 파운데이션 모델은 인공지능의 활용성과 범용성을 폭발적으로 확장시키고 있다. 금속활자의 출현이 개인의 능력을 확장시키며 출발하여 사회에 영향을 주었다면, AI 파운데이션 모델은 개인과 조직, 사회의 능력을 확장시키며 즉각적으로 대응할 수 있게 하는 특징을 지닌다.
[그림1] 구텐베르크 인쇄술과 AI 파운데이션 모델의 비교
인공지능 모델의 활용성은 축적된 데이터에서 출발한다. 대화형 언어모델(자연어처리 모델)은 빅데이터 훈련과 인공지능 응용을 통하여 초거대 인공지능으로 발전했다. 이를 통해 문서를 생성하고, 요약하고 보고서를 작성하며 프로그래밍까지 해낸다. 사전 학습된(Pre Training) 모델은 약간의 추가 학습(Fine Tuning)으로 다른 분야의 다양한 문제를 효율적으로 해결할 수 있게 발전하고 있다.
초거대 생성형 인공지능과 파운데이션 모델
AI 파운데이션 모델은. 언어처리와 생성을 위한 대규모 모델(Large Language Model)이다. 기존 모델과 달리 폭발적 파라메터를 활용하여 학습한 초거대 언어모델로 등극하고 있다. 이를 통해 인간의 지적 업무를 수행하거나 보조할 수 있다. 학습된 초거대 언어 모델은 초기의 알고리즘 적용을 거쳐 머신러닝 기법(CNN, RNN, Transformer)이 활용되어 발전했고, 다시 사람의 피드백 강화학습(RLHF, Reinforcement Learning from Human Feedback) 모델로 증강되어 그럴듯한 현실성을 갖춘 모습으로 서비스되고 있다.
[그림2] AI 파운데이션 모델과 아키텍처의 특징을 보여주고 있다. 상위에 있는 BERT와 GPT는 자연어 텍스트를 이해하고 생성하도록 설계됐다. BERT는 양방향 접근 방식으로 자연어 처리에서 주어진 문장의 문맥 이해, 감정분석으로 광범위한 NLP에서 자주 사용된다. 반면 GPT는 단방향 접근 방식으로 문장을 생성하는 것에 중심을 둔다. 번역, 챗봇 등에 사용되며 문장을 완성하고 요약하는 특징을 지닌다.
[그림2] AI 파운데이션 모델과 아키텍처의 특징
AI 파운데이션 모델의 사전 학습 방법은 다른 산업분야에서 적용되어 상대적으로 적은 데이터로 정확도 높은 빠른 학습을 만들어 낼 수 있다. 결과적으로 개발 시간단축 및 비용절감 효과를 창출해 시장 대응성을 높이도록 돕는다.
YOLO(You Only Look Once)와 SSD(Single Step Detection)는 객체 인식(Objection detection)을 위한 파운데이션 모델이다. 이미지에서 배경과 사물을 분류에 주로 사용되며, 차량 감지와 인식, 추적 등에서 활용된다. 이미지 기반의 파운데이션 모델은 주로 자율 주행 자동차, 안면 인식 및 물체 감지와 같은 애플리케이션과 CCTV에서 사용된다.
파운데이션 모델과 범용성
AI 파운데이션 모델에 날씨 데이터를 활용, 분석하면 날씨의 패턴을 예측하며 작물과 식물의 재배, 작황을 예측 및 최적화하며 관리할 수 있으며, 비료의 투입 시기와 수분 조절을 가늠할 수 있다. 교육에서는 개별화된 학습 기능을 제공함으로써 학생의 결과를 예측하고, 개인화된 권고안을 제시할 수 있다. 일례로 추가 학습이 필요한 영역을 식별하여 안내할 수 있다.
금융, 보험 및 증권 산업에서는 고객 데이터를 분석하여 잠재적인 위험을 식별하고 고객의 요구에 가장 적합한 솔루션을 추천할 수 있으며 위험 평가, 사기 적발 및 청구 처리에 응용된다. 미디어와 엔터테인먼트에서는 고객의 시청 성향을 분석하여 사용자에게 맞춤형 서비스를 제안한다. 공공기관과 정부에서는 데이터 분석을 통해 예산과 리소스가 잘못 할당된 영역을 식별하고 서비스 제공을 개선하며, 사기와 범죄를 사전 예방하는데 활용할 수 있다.
방대한 빅데이터의 활용, 이론적 머신러닝 기법의 구현과 강화학습의 접목돼 등장한 AI 파운데이션 모델은, 지속적인 자본 투자와 AI 반도체 활용, 참여자의 끊임없는 노력이 어우러져 나날이 고도화되고 있다. 챗GPT와 같은 우수한 학습 모델은 모든 분야에 바로 응용될 수 있는 범용성을 지닌다. 구텐베르크 인쇄술의 지식과 정보 공유 및 생산 방식을 바꿔냈다. AI 파운데이션 모델은 정보 생성과 인사이트, 창조의 영역으로 업데이트되며 확장되고 있다.
* 최형광 교수(hk.choi@ssu.ac.kr)는 숭실대학교 일반대학원 AI·SW융합학과에서 학생들을 지도하고 있다. ciokr@idg.co.kr