Offcanvas

AI / 개발자 / 머신러닝|딥러닝 / 오픈소스

칼럼 | AI 시대, 오픈소스의 핵심 문제는 ‘라이선스’

2024.03.06 Matt Asay  |  InfoWorld
소프트웨어의 자유. 사용자의 자유. 왜 이런 자유가 보장되어야 할까? 오픈소스가 클라우드 및 AI 기술 현실을 반영하지 못하는 지금 시기에 꼭 짚어봐야 할 주제다.
 
ⓒ Getty Images Bank

오픈소스 업계에 중대한 문제가 생겼다. 이전과는 다른 문제다. 오픈소스 코드를 공개했다고 허위로 소개하는 기업이 생겨나고 있으며 이를 비난하는 사람도 늘고 있다. 여기에 기업 이익을 위해 오픈소스를 만드는, 어떤 면에서 오픈소스의 의미를 희석시키는 기업 유입에 대해 한탄하는 사람도 늘고 있다.

그러나 문제는 기업이 아니다. 적어도 핵심은 아니다. 기업이 상업적 이익을 추구하기 위해 오픈소스 마케팅을 하는 사레는 과거에도 있었다. 과거와 달리 지금 달라진 점은 지난 몇 년 동안 오픈소스 소프트웨어가 방향성을 잃으며 개발자(및 기업)가 선택할 수 있는 라이선스가 하나만 남았다는 것이다. 바로 허용성이 높은 걸로 유명한 아파치 스타일의 라이선스다.

오픈소스 라이선스가 처음 촉발되던 1980년대 (까다롭고 엄격한 지지자의 주장이긴 하지만) 오픈소스는 ‘공개된 소스’라는 개념보단 GPL로 대표되는 카피레프트 방식 즉 ‘자유’ 소프트웨어라는 가치를 추구했다. GPL 개념을 제시한 리차드 스톨먼은 자신이 만든 재단 FSF(Free Software Foundation)에 대해 “우리 재단은 ‘자유’를 지지하는 것이다. 오픈소스 지지자로 분류되지 않았으면 한다”라고 언급한 이유도 그런 이유에서다.

기업을 비난하기는 쉽다. 우리가 진짜 들여다봐야 하는 문제는 오픈소스 소프트웨어를 기업에 도입하기 위해 서두르는 과정에서 사용자의 자유를 보호할 수 있는 많은 힘이 사라지고 있다는 부분이다.

‘기브앤테이크가 보이지 않는다
우리가 아무리 그럴싸하게 포장하고 싶어도 ‘오픈소스 AI’와 같은 것은 존재하지 않는다. 오픈소스 정의를 제시한  오픈소스 이니셔티브(OSI)조차도 가중치, 부동소수점, 학습 데이터의 세계에서 ‘오픈소스’를 어떻게 정의할지 고민하는 데 1년이 넘는 시간을 보내고 있다.

OSI의 전무이사 스테파노 마풀리는 “오픈소스는 소프트웨어가 배포되고 실행되는 방식의 변화를 따라가지 못했다”라고 밝혔다. OSI는 AI와 관련해 오픈소스 정의 문제에 대한 해결책을 2024년 10월까지 마련할 계획이다.

AI 세계에서 혼란이 가득한 것은 당연한 일이다. 예를 들어, 메타는 대규모 언어 모델(LLM)인 라마를 ‘오픈소스’로 제공했다. 이때 메타는 “라마를 연구 및 상업적 용도로 무료로 사용할 수 있다”라는 소개 문구를 제공했다. 얼핏 보면 일반적인 오픈소스 정의를 따르지 않는 것처럼 보인다. 실제로도 사용자는 다른 LLM을 개선하려 할 때 혹은 일일 활성 사용자가 7억 명을 초과한 상황이라면 라마를 사용할 수 없다. ‘코드를 특정 분야에서 프로그램을 사용하는 것을 제한할 수 없다’라는 내용을 담고 있는 OSI의 오픈소스 라이선스 소개와는 상충되는 내용이다.

메타의 AI 연구 담당 부사장인 조엘 피노는 현재의 오픈소스 라이선스는 학습 데이터가 큰 역할을 하는 오늘날의 AI 시대에 적합하지 않는 동시에 자칫 사용자에게 무리한 책임을 부과할 수 있다고 설명했다. 마풀리도 이에 동의하며 “오픈소스 커뮤니티의 많은 원칙을 유지하면서 AI 모델의 저작권과 권한의 실제 한계를 해결하는 방식으로 라이선스를 재고해야 한다”라고 밝혔다.

AI 시대를 지나며 우리는 라이선스 문제를 적극 들여다보고 있지만, 클라우드 컴퓨팅 업계는 이미 비슷한 문제를 마주해왔다. 가령 소프트웨어 배포를 어떻게 정의할지, 다운스트림 개발 기업을 어떻게 지원할 지 등의 문제가 있었지만 오픈소스 업계는 명확한 대응책을 마련하지 못했다.

오픈소스 업계는 업스트림 개발자의 소프트웨어 통제권보다 다운스트림 개발자가 원하는 대로 코드를 사용할 수 있는 권리를 우선시해 왔다. 필자 스스로도 전에는 이런 종류의 논의가 어리석다고 썼지만 지금은 무엇이 중요한지 확신이 서지 않는다.

사용자 그리고 소프트웨어 자유 모두 중요하다
필자는 수년 동안 라이선스 문제에 대해 생각해 왔다. 2005년에 오픈소스의 상업적 성공 과정에서 GPL보다 더 많은 의미 있는 역할을 한 오픈소스 라이선스는 없다고 주장했다. 2009년에는 아파치 소프트웨어 라이선스라는 열차에 몸을 실었다. 2014년에는 라이선스에 무관심한 깃허브 사용자와 관련해 글을 쓰기도 했다. 이러한 문제 중 어느 하나도 간단하지 않기 때문에 필자가 취했던 입장에서도 맞고 틀린 부분 모두 있었다고 생각한다.  

거기다 필자는 지난 몇 년 동안 허용성이 높은 아파치 스타일의 라이선스가 커뮤니티 발전에 더 좋다고 주장해 왔다. 그런데 하지만 정말 그럴까? 예를 들어 리눅스 프로젝트처럼 GPL이 적용된 수많은 커뮤니티가 발전했다. GPL 기반 소프트웨어에는 이미 ‘자유로운’ 활용이 가능했기에 굳이 프로젝트를 복사해 커뮤니티가 분열되는 경우가 거의 없었다. 필자는 이 점이 매우 중요하다고 생각한다. 그렇기에 지금 더욱더 아파치 라이선스가 지켜온 개발자/사용자의 자유뿐만 아니라 GPL이 주창하던 소프트웨어의 자유의 가치를 다시 강조하고 싶다.

자유 소프트웨어와 오픈소스(GPL 대 아파치) 간의 초기 논쟁은 지루하기 짝이 없었지만, 그 긴장감은 소프트웨어 산업 전반에 좋은 영향을 끼쳤다. 프로젝트 메인테이너에게 카피레프트를 포함한 여러 선택권을 부여했기 때문이다. 아쉽게도 그런 선택권은 클라우드가 등장하면서 사라지고 다시 회복되지 않고 있다. ‘악의 축’으로 종종 묘사됐던 기업조차도 클라우드 이전에는 자유도가 높은 오픈소스 라이선스가 유용하다고 보며 활용하기도 했다. 현재 기업들이 새로운 라이선스를 개발하는 이유는 기존 오픈소스 라이선스 방향을 주도하던 FSF와 OSI가 여전히 과거에 머물러 있는 반면 소프트웨어는 너무나도 앞선 미래를 향해 달려가고 있기 때문이다. 그 과정에서 개인 및 기업 개발자는 선택권을 잃고 있다.

그렇다고 해서 수십억 달러 규모의 투자를 받은 스타트업이나 그들이 출시한 소프트웨어로 수익을 창출하고자 하는 기업을 안타까워할 필요는 없다. 또한 오픈소스 소프트웨어의 안정적인 공급을 비즈니스 모델로 삼는 수조 달러 규모의 클라우드 회사를 위해 눈물을 흘릴 필요도 없다.

기업은 잊어버리자. 대신 자신의 소프트웨어의 자유로운 사용을 보장하고 싶은 개발자를 생각하자. 클라우드와 AI 시대 카피레프트 개념은 등한시되고 있지만 분명 적극 검토해야 할 주제이다. 오늘날 개발자는 사실상 하나의 (허용도가 높은) 오픈소스 라이선스만 선택할 수 있다. 이는 장기적인 관점에서 좋지 않다. 오픈소스는 중요하다. FSF가 추구하는 자유 소프트웨어도 중요하다. 우리 모두 오픈소스 업계에 존재했던 다양한 자유의 가치를 되찾아야 한다.

*필자 Matt Asay는 몽고DB에서 개발자 릴레이션 부서에 속해 있다.
ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.