오픈AI가 GPT-4를 콘텐츠 조정 업무에 활용하는 방안을 제시하면서, 의도치 않은 편견을 해결하려면 사람의 참여가 필요하다고 언급했다.
오픈AI는 최근 소셜 미디어 같은 디지털 플랫폼에서 대규모 콘텐츠 조정(content moderation) 프로세스를 자동화하기 위해 GPT-4 대규모 언어 모델(LLM)을 연구하고 있다.
지난 15일 블로그 게시물에 따르면 오픈AI는 긴 콘텐츠 정책 문서의 규칙과 뉘앙스를 해석하고 정책 업데이트에 즉각적으로 적응할 수 있도록 GPT-4의 기능을 활용하는 방안을 모색하고 있다.
오픈AI는 “디지털 플랫폼의 미래에 긍정적인 비전을 제시할 것이라고 생각한다. AI는 플랫폼별 정책에 따라 온라인 트래픽을 조절하고 인간 모더레이터의 정신적 부담을 덜어줄 수 있다”라고 말했다. 오픈AI의 API에 접근할 수 있는 사람이라면 누구나 자신만의 모더레이팅 시스템을 구현할 수 있다고 오픈AI는 설명했다.
오늘날 콘텐츠 조정은 대부분 수작업으로 진행되기 때문에 오랜 시간이 필요하다. 오픈AI는 GPT-4 LLM을 사용하면 단 몇 시간 만에 맞춤형 콘텐츠 정책을 만들 수 있다고 말했다.
이를 위해 데이터 과학자와 엔지니어는 정책 전문가가 만든 가이드라인과 정책 위반의 실제 사례가 포함된 데이터 세트를 사용해 데이터에 라벨을 지정할 수 있다.
사람이 AI의 콘텐츠 조정 테스트를 지원해야
오픈AI는 “GPT-4는 정책을 읽고 답을 보지 않고도 동일한 데이터 세트에 라벨을 할당한다. 정책 전문가는 GPT-4와 사람의 판단이 어떻게 다른지 조사한 뒤, GPT-4에게 라벨의 근거를 제시하고, 정책 개념의 모호한 부분을 분석하고, 혼란을 해결하고, 정책에 대해 추가 설명을 해달라고 요청할 수 있다”라고 밝혔다.
오픈AI는 LLM이 만족스러운 결과를 생성할 때까지 데이터 과학자와 엔지니어가 테스트를 반복할 수 있다고 말했다. 또 반복 프로세스를 통해 정제된 콘텐츠 정책을 생성해 대규모로 배포하고 콘텐츠를 조정할 수 있다고 설명했다.
GPT-4의 또 다른 이점도 언급됐다. 오픈AI는 GPT-4가 현재의 수동 콘텐츠 관리 방식에 비해 일관되지 않은 라벨링이 줄어들고 피드백 루프 속도도 개선될 것이라고 말했다.
오픈AI는 “기존 수동 콘텐츠 관리 방식은 사람들이 정책을 다르게 해석하거나 일부 운영자가 새로운 정책 변경 사항을 이해하는 데 시간이 오래 걸려 라벨이 일관되지 않을 가능성이 있었다. 반면 LLM은 세세한 문구 차이에 민감하게 반응하고 이를 정책 업데이트에 즉시 적용해 사용자에게 일관된 콘텐츠 경험을 제공한다”라고 전했다.
회사 측에 따르면 새 접근 방식은 모델 학습에 필요한 수고를 줄일 수 있다. 또 오픈AI는 이러한 접근 방식이 모델 자체에 내재된 판단에 따라 무엇이 안전한지 파악하고 콘텐츠를 조정하는 이른바 ‘헌법적 AI(constitutional AI)’와는 다르다고 주장했다. 앤트로픽(Anthropic)을 비롯한 여러 AI 기업에서 모델의 편견과 오류를 줄이는 데 헌법적 AI의 접근 방식을 따르고 있다고 오픈AI는 지적했다. 다만 학습 중 불필요한 편견이 콘텐츠 조정 모델에 유입될 가능성이 있는 것은 새 접근 방식도 마찬가지라고 경고했다.
오픈AI는 “다른 AI 애플리케이션과 마찬가지로 결과 출력에는 사람이 참여해야 한다. 신중하게 모니터링하고 검증하며 개선해야 한다”라고 말했다.
업계 전문가들은 콘텐츠 조정에 대한 오픈AI의 접근 방식을 긍정적으로 보고 있다. AI 서비스 회사 Rapyd.AI의 관리 임원인 토비아스 즈윙만은 “GPT-4는 매우 유능한 모델이다. 오픈AI는 해로운 콘텐츠를 만들려는 사람들과 끊임없이 싸우고 있다”라고 언급했다.
오픈AI의 LLM이 콘텐츠 조정 프로세스 자동화에 성공하면, 시장은 수십억 달러 규모로 성장할 가능성이 있다. 얼라이드 마켓 리서치(Allied Market Research) 보고서에 따르면 글로벌 콘텐츠 조정 서비스 시장은 2021년 85억 달러 규모였다. 2022년부터 2031년까지 연평균 12.2%의 성장률을 기록해 2031년에는 263억 달러에 달할 것으로 예상됐다. ciokr@idg.co.kr