Offcanvas

AI / 라이프 / 로봇|자동화 / 머신러닝|딥러닝 / 소비자IT

블로그 | GPT-3 기반 AI로 글쓰기, 정말 AI가 글까지 써낼까?

2022.12.20 Galen Gruman  |  InfoWorld
2022년 11월 30일, AI 기반 대화 도구 챗GPT(ChatGPT)는 출시 일주일 만에 대화 능력과 창의성으로 미디어에서 많은 화제가 되고 사용자를 매료시켰다. 챗GPT에 열광한 사용자는 마케팅 카피, 광고, 에세이, 보고서, 전문 과학 보고서 등을 제외한 거의 모든 문서를 사람 없이 작성할 수 있을 것이라고 외쳤다. AI가 모든 고객을 대상으로 한 서비스 전화, 약속 잡기 및 기타 일상적인 대화를 처리할 것이라고 말이다.

하지만 너무 서두르는 게 아닐까? 기반 기술을 두고 실험해 본 결과 아직 갈 길이 멀다는 것을 알 수 있었다.
 
챗GPT와 이전 AI 원더카인드(AI wunderkind)의 차이점은 IT나 비즈니스 미디어뿐만 아니라 일반인에게도 주목을 받았다는 점이다.
 
ⓒ Getty Images Bank

챗GPT가 출시된 지 1주일 만에 교사인 필자의 친구는 AI로 작성한 학기말 논문을 가려낼 수 있는지를 물어왔다. 위키백과와 웹에서 그대로 문장을 잘라내 붙여 넣는 것을 단속하는 것도 충분히 힘든 일이지만, 아예 논문을 원본으로 작성하는 AI 도구가 보편화되면 에세이와 보고서를 읽고 학생의 학습 수준을 판단하는 것이 무의미해질 것이다. (질문과 답변으로 이루어진 구두 발표로 시험 형식을 바꾸면 학습한 내용을 아무런 도움 없이 실시간으로 답해야 하므로 문제를 해결할 수 있지만, 그렇게 긴 시험 시간을 허용하는 학교는 없다.)
 

챗GPT와 GPT-3는 무엇인가?

챗GPT는 마이크로소프트, 링크드인 공동 설립자인 리드 호프만과 VC 회사 코슬라 벤처스가 후원하는 연구 회사인 오픈AI 재단이 만들었다. 다양한 정보에 액세스하고, 실제로 사람이 하는 것처럼 정보를 집계· 합성·작성하는 자연어 시스템을 만들려는 노력의 최신 결과물이다. 오픈AI의 GPT-3(Generative Pretrained Transformer 3) 데이터베이스와 엔진을 사용하며, 엔진이 분석한 수백만 개의 기사를 습득해 자연어 텍스트에서 개념과 표현 간의 관계뿐 아니라 해당 개념의 의미를 ‘이해’할 수 있다. 오픈AI는 GPT-3가 1,750억 개의 매개변수로 자연어 모델을 처리할 수 있다고 발표했다.

GPT-3는 새로운 것은 아니지만 오픈AI는 기술이 어떻게 사용되는지, 특히 중요한 것은 인간이 어떻게 수정하는지도 ‘관찰’하여 GPT-3가 자가 훈련할 수 있도록 외부 사용자에게 점점 더 개방하고 있다. GPT-3가 많은 관심을 받기는 했지만 이 분야에서 유일한 자연어 AI 게임은 아니다. 제임스 코비엘루스가 InfoWorld에 밝힌 것처럼, 마이크로소프트는 딥스피드(DeepSpeed)를, 구글은 스위치 트랜스포머(Switch Transformer)를 소유하고 있는데 둘 다 1조 이상의 매개 변수를 처리할 수 있다(GPT-3가 비교적 원시적으로 보이는 수준이다).

지금까지 여러 AI 시스템에서처럼 GPT-3도 흥분하면 길을 잃어버리는 GPT 기반 서비스 초반 특유의 치명적인 약점이 있다. 인간의 글쓰기와 마찬가지로 필터와 자기 검열이 부족한 유해한 콘텐츠를 생성한다는 것이다. 인종 차별, 성 차별, 기타 불쾌한 편견, 거짓말, 의도 숨기기, 가짜 뉴스 등을 말한다. 오픈AI 팀도 이 위험을 충분히 이해한다. 2019년에는 악의적인 사용을 방지하기 위해 이전 GPT-2 시스템에 대한 공개 액세스를 비활성화했다.

그럼에도 GPT-3가 작성한 내용을 읽어보면 매우 놀랍다. 일부 텍스트는 매우 인간적이며, 튜링 테스트도 쉽게 통과한다. 사람이 쓴 것인지 기계가 쓴 것인지 알 수 없음을 의미한다. 그러나 자연스럽게 문장을 쓰는 능력이 실제로 무슨 말을 하고 있는지를 안다는 뜻은 아니다. 일반 사용자가 너무 깊이 파고들 필요는 없다.
 

GPT-3 실험, 한계 명확해

올해 초, GPT-3를 사용하는 콘텐츠 생성기 중 하나인 카피스미스(Copysmith)의 카피스미스.AI(Copysmith.AI) 도구를 사용해 보았다. 목표는 Computerworld의 모회사 파운드리(Foundry)의 인간 기자나 필자를 보완할 수 있는지를 시험하는 것이었다. 소셜 게시물 작성을 돕고, 수습 기자가 손 댈 수 있을 만한 주제를 탐색하고, 지진 위치와 강도, 주식 결과 및 스포츠 점수 같이 간단한 보도자료를 요약하며, 공식적인 이야기를 작성하는 콘텐츠 생성기가 있는 것처럼 사용하는 것이다.

비록 카피스미스 측에서는 초보 기자나 작가에게 카피스미스.AI가 주제와 문구를 탐색하는 출발점으로 활용될 수 있다고 말했지만, 마케팅 전략을 보면 구글 검색 결과에 나타날 확률을 높이고, 신뢰할 수 있는 텍스트를 제공하는 웹 사이트 제작자를 겨냥한다. 방대한 소셜 네트워크 분야에서 사용할, 가능한 한 많은 홍보 텍스트를 변형한다. 이러한 텍스트는 숙련된 작가가 거의 없는 전자 상거래 및 인플루언서의 세계에서는 필수적이다.

카피스미스 같은 서드파티는 오픈AI의 텍스트 스니펫만으로만 작업하는 제한을 받으므로 오픈AI의 GPT-3 엔진의 부하를 줄인다. 동시에 해당 엔진에 필요한 노력도 제한한다. (AI 기반 콘텐츠 생성기는 일반적으로 1,000자 이하, 약 150~200단어 또는 한두 단락 정도의 초안 작성의 제한을 둔다.)

GPT-3는 전문 작가에게 위협이 되지는 못하지만, 그 단순한 목표만으로도 몇 가지 기본적인 경우에 사용될 수 있는 이유를 증명했다. 환상적인 기술이라면 으레 그렇듯, 미래는 어느 측면에서 보느냐에 따라 보이는 것보다 멀기도 하고 더 가깝기도 하다.

GPT-3로 Copysmith.AI 테스트에서 좋았던 점은 소셜 프로모션이나 마케팅 자료에 사용할 만한, 제목과 첫 단락으로 이루어진 작은 텍스트 덩어리를 만드는 것이었다. 소스가 되는 텍스트가 명확하고, ‘그러나’ 같은 접속사를 연이어 쓰는 문제가 없다면 카피스미스.AI는 쓸 만한 텍스트를 만들어냈다. 그러나 때로는 요약이 너무 압축적이어서 문단을 문장으로 나눌 수 없었고, 중요한 주제나 하위 요소가 없는 지나치게 단순한 글을 써냈다.

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.