Offcanvas

AI

오픈AI, 책임감 있는 AI 형성 위한 프레임워크 ‘모델 스펙’ 공개

2024.05.13 Gyana Swain  |  Computerworld
오픈AI가 AI 개발의 책임성과 투명성 개선을 위해 '모델 스펙(Model Spec)' 초안을 공개했다. 모델 스펙에는 API와 챗GPT에서 모델 행동을 안내하는 원칙이 요약되어 있다.
 
ⓒ Getty Images Bank

오픈AI는 블로그에서 "모델 행동을 형성하는 실질적인 선택 사항을 이해하고 논의할 수 있어야 한다는 생각에 모델 스펙을 제작했다. 모델 스펙에는 오픈AI에서 쌓아 온 기록 문서와 모델 행동 설계에 대한 연구 및 경험, 그리고 향후 모델 개발에 제공하기 위해 진행 중인 작업이 반영돼 있다. 모델 스펙은 사람의 입력을 통해 모델 행동을 개선하려는 지속적인 노력의 연속이며, 모델 안전을 조성하기 위한 집단적이고 조직적인 접근 방식을 보완한다"라고 설명했다. 

모델 행동은 AI 모델이 사용자 입력에 반응하는 방식이다. 어조, 성격, 응답 길이 등 다양한 측면을 포괄하며, AI와 인간의 상호 작용에서 중요한 역할을 한다. 하지만 모델은 다양한 데이터 세트를 학습하고 상충하는 목표에 직면할 수 있기 때문에 행동을 형성하는 것은 복잡한 작업이다. 오픈AI는 모델이 명시적으로 프로그래밍되지 않고 광범위한 데이터에서 학습하므로 이런 행동을 형성하는 것은 아직 초기 단계의 과학이라고 말했다. 


책임감 있는 AI를 형성하는 3단계 접근 방식

모델 스펙 문서 초안은 원하는 AI 행동을 형성하기 위한 3가지 접근 방식을 다룬다. 블로그에 따르면, 문서에는 "원하는 모델 행동"과 "충돌이 발생할 때" 오픈AI가 트레이드오프를 평가하는 방법이 명시돼 있다. 

모델 스펙의 첫 번째 부분은 핵심 목표에 초점을 맞춘다. 사용자의 목표 달성 지원, 인류에 대한 혜택, 오픈AI에 대한 긍정적 반영 등 모델 행동을 안내하는 광범위한 원칙이다. 이런 기본 원칙은 또한 모델 행동이 "사회적 규범과 관련 법률"을 준수하도록 요구한다. 

이런 광범위한 목표 외에도 모델 스펙은 "규칙"이라고 부르는 명확한 지침도 제공한다. 이런 규칙은 복잡한 상황을 해결하고 AI 작업의 "안전과 적법성을 보장"하기 위해 고안됐다. 대표적인 요소는 사용자의 지시 준수, 법률 준수, 정보 위험 생성 방지, 사용자 권리 및 개인정보 존중, 부적절하거나 업무상 안전하지 않은(not safe for work, NSFW) 콘텐츠 생성 방지 등이다. 

마지막으로, 모델 스펙은 목표와 규정이 "충돌"하는 상황이 있을 수 있음을 인정한다. 이런 복잡성을 해결하기 위해 문서에는 AI 모델이 따라야 할 기본 동작을 제안한다. 최선의 의도를 가정하고, 경계를 "넘지" 않고 도움을 주며, 존중하는 상호 작용을 장려하는 것 등이다. 

리서치 및 컨설팅 기업 카운터포인트 리서치(Counterpoint Research)의 리서치 부사장 닐 샤는 모델 스펙에서 제시하는 것이 "모델이 이상적으로 가야 할 방향이며, 오픈AI가 더 큰 맥락과 개인화를 통해 사용자에 따라 모델이 어떻게 행동해야 하는지에 대한 새로운 노력을 하고 있다"라고 말했다. 


"살아있는 문서"

오픈AI는 블로그 게시물에서 모델 스펙을 "살아있는 문서"라고 표현했다. 개방적으로 피드백을 받고 발전하는 AI 분야와 함께 진화하고 있음을 의미한다. 

모델 스펙을 자세히 설명하는 오픈AI의 또 다른 문서는 "오픈AI의 의도는 연구자와 데이터 라벨러가 인간 피드백을 통한 강화 학습(learning from human feedback, RLHF)이라는 기술의 일부로 데이터를 생성하는 데 모델 스펙 지침을 사용하는 것이다. 모델 자체와 마찬가지로 모델 스펙은 공유와 이해관계자의 피드백을 통해 학습한 내용을 바탕으로 지속해서 업데이트될 것"이라고 설명했다. 

샤는 "RLHF는 모델이 인간의 실제 행동에 더 잘 부합하도록 조정할 뿐 아니라 설정된 목표, 원칙 및 규칙을 통해 모델을 투명하게 만드는 방법을 주도할 것이다. 오픈AI 모델이 한 단계 발전하고 더 책임감 있고 유용해지는 데 도움이 된다. 물론 쿼리가 해석되는 방식과 최종 목표에 대한 회색 지대가 많고, 쿼리와 응답의 책임감이 떨어지는지 감지할 정도로 지능적인 모델이 되어야 하므로 이런 목표 역시 끊임 없이 움직일 것이다"라고 말했다.

모델 스펙은 윤리적 AI를 실현하기 위한 중요한 발걸음이다. 오픈AI는 일상에서 AI 시스템과 점점 더 많이 상호 작용하는 사용자와 신뢰를 구축하는 것이 중요하다고 강조했다.
editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.