Offcanvas

AI / 머신러닝|딥러닝 / 보안 / 비즈니스|경제

‘생성형 AI에 규제 필요한가?’… 미국 저작권청, 공개 의견 요청

2023.09.01 Lucas Mearian  |  Computerworld
AI가 콘텐츠를 제작할 때 저작권이 있는 자료를 무분별하게 사용하는 이유에 대해 미국 저작권청이 공개 의견을 요청했다. 조사 결과를 의회에 전달할 예정이다.
 
ⓒ Getty Images Bank

미국 저작권청이 지난달 30일부터 생성형 AI 관련 저작권법과 정책 문제를 두고 대중의 의견을 수렴하고 있다. 연방 입법 또는 미국 정부의 규제가 필요한지 여부도 파악한다. 의견 제출은 오는 11월 15일까지 가능하다. 

생성형 AI 기술은 기초 언어 모델을 학습시키기 위해 저작권이 있는 창작물에 의존하는 것으로 알려져 있다. 저작권청의 이번 의견 수렴은 창작물 사용과 관련된 적절한 수준의 투명성, AI 생성 결과물의 법적 상태, 인간 예술가의 개인적인 속성을 모방한 AI 생성 결과물의 적절한 처리 방향에 대해 묻는다.

저작권청은 생성형 AI 및 기타 인공지능 기술에 의한 저작권 침해 문제를 조사하기 위해 지난 3월 인공지능 이니셔티브를 출범했다. 이후 공개 세션 4회와 웨비나 2회를 개최하며 저작권 자료 사용에 대해 연구해 왔다.

저작권청은 이미 피드백과 질문을 일부 수집했지만, 대중의 폭넓은 의견을 듣기 위해 공개 페이지를 열었다. 대중의 의견을 바탕으로 의회에 조언하고, 기관의 자체 규제 업무를 안내하며 저작권 침해 문제를 고민하는 일반 대중과 법원 및 기타 정부 기관에 정보를 제공할 계획이다.

미국 저작권청의 저작권 등록 책임자인 시라 펄뮤터는 “올해 초 이니셔티브를 시작해 점점 더 복잡해지는 생성형 AI의 문제에 집중했다. 이 문제는 기술의 발전과 인간 창의성의 미래에 매우 중요하다. 미국 저작권청이 해당 문제를 지속적으로 검토해 나가고자 한다”라고 설명했다.

리서치 기업 에베레스트 그룹의 기술 실무 임원인 니티시 미탈은 AI 저작권 침해 이슈가 미디어 및 엔터테인먼트 산업의 핵심 문제라고 지적했다. 미탈은 최근 몇 달 동안 미국 작가조합(WGA)을 비롯해 사라 실버만, 크리스토퍼 골든, 리처드 카드레이 등 유명인들이 저작권 침해 문제로 오픈AI(OpenAI)와 메타(Meta)에 소송을 제기한 사례를 언급했다. WGA는 AI가 생성한 콘텐츠의 사용을 금지하는 방안을 추진하고 있다.

생성형 AI와 관련해 현재 가장 큰 문제로 언급되는 부분은, AI 모델이 생성한 콘텐츠의 소유자가 누구인지 명확하지 않다는 점이다.

미탈은 “기술 제공업체들은… 이러한 AI 모델의 플랫폼 역할을 하고 싶어 하지만, 시스템이 생성하는 콘텐츠에 대한 법적 권리와 정당한 소유권을 누가 갖는지에 대해서는 언급하지 않는다”라고 말했다. 그는 저작권청의 이번 조사가 중요하긴 하나 예상할 수 있었던 일이라고 밝히며, AI에는 각별한 주의가 요구되는 4가지 위험 요소가 있다고 주장했다.

데이터 보안 및 프라이버시(Data security and privacy)
ㆍ설명 가능성(Explainability)
ㆍ소유권 및 책임(Ownership and responsibility)
편견과 윤리(Bias and ethics)

저작권청은 이번 의견 수렴 과정에서 콘텐츠 제작자(작가, 스튜디오 등), 법인(규제 기관, 변호사, 법원 등), 기술 제공자(기술 대기업 및 기초 모델 제공업체)의 적극적인 피드백을 요청하고 나섰다. 미탈은 이러한 피드백이 공통의 규제 프레임워크를 마련하고 일관되게 시행하는 데 필요하다고 언급했다.

그는 “이러한 의견 수렴이 기술 기업들에게 부정적인 조치라고 생각하지 않으며, 책임감 있게 AI를 채택하기 위해 필요한 단계라고 생각한다. 현재 콘텐츠 및 결과물의 소유권에 대한 규제가 모호하기 때문에 많은 대기업이 AI 도입을 재고하고 있다. 이를 해결하기 위한 프레임워크와 법안이 마련되면 장기적으로 도움이 될 것이다”라고 말했다.

한편, 챗GPT 등장 이후 위험성에 대해 여러 의견이 이어지자, 바이든 행정부는 생성형 AI에 대처할 수 있는 방안을 모색해 왔다. 지난 5월에는 카말라 해리스 부통령과 행정부 관계자들이 구글, 마이크로소프트, 오픈AI, 앤트로픽의 CEO를 만나 대책을 논의하기도 했다. 회의에 참석한 기업 CEO들은 AI 기술 개발의 자발적인 규제를 ‘약속’했지만, 법적 효력은 없는 것으로 알려졌다.

가트너 수석 부사장이자 애널리스트인 아비바 리탄은 생성형 AI 모델 학습의 저작권 문제가 “구시대적 규제와 새로운 혁신이 충돌하는 지점”이라고 설명했다. 그녀는 “이 문제가 어떻게 해결될지 아직은 확신할 수 없다”라고 덧붙였다.

생성형 AI가 사용자 쿼리에 응답할 수 있는 기반인 대규모 언어 모델(LLM)은 텍스트, 음성, 이미지, 비디오 등 콘텐츠를 생성하는 데 수십억에서 수조 개에 이르는 매개변수를 활용한다. LLM이 고객을 위한 맞춤형 결과물을 제공하기 위해서는 인터넷뿐만 아니라 개인 정보를 수집하는 기업과 같이 무수히 많은 소스에서 데이터와 정보를 학습해야 한다.

AI 기술이 발전하면서 미디어 콘텐츠의 출처와 이력을 인증하기 위한 기술 표준도 등장하고 있다. 어도비가 마이크로소프트, 트루픽(Truepic), 암(Arm), 인텔, BBC와 함께 설립한 비영리 산업 단체 ‘콘텐츠 출처 및 진위 확인을 위한 연합(C2PA)’이 대표적이다. 여기에는 생성형 AI가 만든 콘텐츠의 인증도 포함된다.

리탄은 “저작권을 식별하는 표준을 통해 생성된 자료는, LLM 및 기타 생성형 AI 모델이 콘텐츠를 생성할 때 다시 소싱할 수 있다”라고 말했다. 인증 표준이 구축되면 “저작권 표시 자료가 생성형 AI 모델의 응답 생성을 위해 학습하는 데 사용됐다고 알릴 수 있다”라고 리탄은 전했다.

리탄에 따르면 코드위스퍼러(CodeWhisperer), 깃허브 코파일럿(Github Copilot) 같은 코드 생성 제품은 코드 제안 항목에 라이선스 정보가 포함되며, 라이선스 조건을 이해하도록 코드 저장소로 돌아가는 링크가 참조 트래커를 통해 제공되고 있다. 리탄은 “업계가 저작권 자료에 대해서도 이와 같은 개념을 구현하지 못할 이유는 없다”라며 “규제 당국은 호스팅 LLM 벤더에 지장이 없도록 하거나, 소급 적용할 수 있는 관련 표준을 마련해야 한다”라고 주장했다. 

만약 소급 적용이 가능할 경우 LLM 제작자가 먼저 저작권이 있는 콘텐츠에 표시를 한 뒤, 벤더가 표시된 콘텐츠를 사용해 모델을 재교육해야 하기 때문에 작업은 더 까다로워질 수 있다.

“어느 쪽이든 이러한 솔루션을 구현하는 데는 많은 시간과 비용이 소요된다. 특히 규제 당국은 지금 당장 정책을 마련하고 이를 시행할 수 있도록 기간을 정해야 한다”라고 리탄은 말했다. 그는 “또 다른 선택지도 있다. 자료를 일단 모두 무시하고 법을 변경해 생성형 AI 애플리케이션에 저작권 보호가 적용되지 않도록 하는 것이다. 일본이 이 방법을 택했다”라고 덧붙였다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.