2020.09.29

칼럼 | 스노우플레이크는 오픈소스의 종말을 의미할까

Matt Asay | InfoWorld
최근 클라우드 데이터 웨어하우스 업체 스노우플레이크(Snowflake)의 기업 공개(IPO)는 큰  사건이었는데, 단순히 엄청난 가치평가 때문만은 아니었다.
 
© wezlo

2013년 클라우드 컴퓨팅 업체 클라우데라(Cloudera)의 공동 설립자인 마이크 올슨이 '엔터프라이즈 인프라의 놀랍고 돌이킬 수 없는 추세'라고 자신 있게 선언한 것이 있었다. 바로 비개방형 소스(closed-source)의 독점적 형태로는 지배적인 플랫폼이 더는 나오지 않을 주장했다. 그러나 클라우드 기반 엔터프라이즈 데이터 플랫폼인 스노우플레이크는 이런 추세, 즉 오픈소스 인프라 시대가 저물고 있음을 의미하는 것일 수 있다.

물론 빅데이터 분석 소프트웨어 업체인 스플렁크(Splunk)도 있다. 하지만 라이트스피트(Lightspeed)의 파트너 구라브 굽타에 따르면, 스플렁크는 오픈소스로 자리를 잡기 전의 사례다. 마이SQL, 아파치 하둡(Apache Hadoop), 몽고DB(MongoDB), 아파치 스파크(Apache Spark)는 모두 (적어도 초기에는) 오픈소스였다.

그리고 지금 스노우플레이크가 화제의 중심이다. 스노우플레이크는 과대평가된 것일까. 혹은 오픈소스 인프라 시대가 막바지로 치닫고 있는 것일까.
 

오픈소스의 종말?

이 질문에 대한 답은 기본적으로 이 전제를 얼마나 적극적으로 옹호할 준비가 됐는지에 따라 달라진다. 일단 모든 ‘지배적 플랫폼 수준의 소프트웨어 인프라’가 오픈소스는 아니다. 그렇지만, 지난 10~20년 동안 엔터프라이즈 인프라의 대부분이 오픈소스로 전환했다는 것은 절대적으로 사실이므로, 올슨의 핵심 주장을 반박하려는 것은 아니다.

레드햇 이머징 기술 전문가 고든 하프는 “오픈소스를 주로 사용하는 인프라는 2가지로 나눌 수 있다. 먼저 대부분의 이런 오픈소스 관련 기술은 노SQL(NoSQL), 하둡, 카프카(Kafka), 스파크(Spark), 셉(Ceph), 주피터(Jupyter) 등이다. 하지만 이런 기술을 사용하지 않는 오픈소스도 있다. 대부분 클라우드 서비스 관련된 것으로, 태블로(Tableau), 스플렁크(Splunk) 등이다”라고 말했다. 스노우플레이크 역시 후자에 속하는 것은 물론이다.

지난해 오픈소스의 활발한 활동과 성과를 보면 다소 의외로 생각하겠지만, 사실 개발자는 오픈소스에 믿음이 매우 깊은 적이 없었다. 그런데도 오픈소스가 확산하는 ‘놀라운’ 추세가 나타난 이유는 그저 오픈소스를 사용하면 쉽게 액세스할 수 있는 고품질 오픈소스 데이터 인프라 덕분에 개발자가 더 쉽게 작업할 수 있기 때문이다. 물론, 소프트웨어 스택을 더 세세하게 제어하려는 욕구와 함께, 종종 오픈소스 프로젝트에 수반되는 커뮤니티와 같은 다른 이점도 있다. 그러나 궁극적으로 오픈소스가 승리한 것은 개발자가 '작업을 쉽게 끝낼' 수 있게 해주기 때문이다.

실제로 개발자가 아파치 에어플로우(Apache Airflow)와 같은 오픈소스 소프트웨어를 사용해 독점적인 스노우플레이크 데이터 플랫폼에 데이터를 기꺼이 로드하는 이유다. 이는 인지 부조화가 아니다. 실용주의일 뿐이다.
 

매니지드 서비스로의 전환

이러한 실용주의에 대해 오픈소스 비즈니스 인텔리전스 개발자 톰 바버는 매니지드 클라우드 서비스로의 전환이 오픈소스로부터 사람들의 관심을 돌린다고 지적했다. 그는 "SaaS를 사용하면 라이선스 비용이 아니라 서비스 비용을 지불하므로, 생각이 다소 바뀐다. 결국, 오픈소스는 라이선스 비용을 지불하지 않지만, 이를 설치, 조정, 실행하려면 내부 또는 외부 전문가에게 비용을 지불해야 한다는 뜻이다. 대부분의 사람은 마이SQL을 적절하게 설치할 수 있지만, 이를 조정하려면 심층적인 지식이 필요하다”라고 말했다.

오픈소스 시장조사업체 레드몽크(Redmonk)의 애널리스트 제임스 거버너는 생각이 조금 다르다. 그는 “클라우드는 오픈소스보다 더 좋은 배포 및 패키징 메커니즘이다. 편리함에서 훨씬 앞선다. 결국은 매니지드 서비스가 이길 수밖에 없다”라고 말했다. 클라우데라의 올슨은 “나는 여전히 오픈소스 소프트웨어가 전략적 이점을 제공한다고 생각한다. 그러나 ‘더 쉬운 사용성’은 10년 전과 달리 현재의 경쟁력이 될 수 없다. 실제로 현명한 클라우드 사용자는 클라우드의 독점 인프라가 구매해 사용하기 매우 쉽다는 교훈을 이미 배웠다"라고 말했다.

이러한 지적을 종합하면 오픈소스든 아니든 상관없다는 말이 아니다. 오히려 그 반대다. 거버너는 “오픈소스는 비즈니스 모델이 아니다. 하지만 소프트웨어를 구축하고, 신뢰를 쌓고, 커뮤니티를 육성하는 좋은 방법이다”라고 말했다.

이어 “이처럼 ‘소프트웨어를 만드는 가장 좋은 방법’은 스노우플레이크와 같은 SaaS 공급업체에도 적용된다. 스노우플레이크와 같은 서비스는 오픈소스가 아닐 수 있지만, 고든 하프의 의견처럼 내부적으로 오픈소스를 적극적으로 사용하고 있다. 예를 들어, 스노우플레이크는 ‘아키텍처의 핵심 부분으로’ 오픈소스 파운데이션DB(FoundatonDB)를 사용한다. 이를 통해 놀랍고 차별화된 기능을 만들어 냈다”라고 말했다.

2019년 오픈소스 관리 솔루션 업체 화이트소스(Whitesource)의 분석에 따르면, 99%의 소프트웨어가 오픈소스를 사용한다. 이런 점에서 스노우플레이크와 오픈소스의 미래를 함께 이야기하는 것은 이번 기업 공개를 너무 좁게 해석한 것이다. 요컨대, 오픈소스는 여전히 ‘매우’ 중요하다.
 

내부에서 작동하는 오픈소스

물론 스노우플레이크와 같은 서비스 구매자에게 오픈소스가 중요한 매력이 아닐 수 있다. 켄 혼의 주장대로 스노우플레이크와 같은 서비스에는 소스 코드가 아니라 데이터가 훨씬 중요하다. 그는 “최소한 클라우드에서는 전체를 오픈소스 소프트웨어로만 구성하는 것이 적합하지 않을 수 있다"라고 말했다.

오픈소스는 오픈소스 기반 빌딩 블록의 풍부한 생태계를 구축할 수 있는 토대를 제공하므로, 데이터 웨어하우징과 기타 이런 서비스를 제공하기로 선택할 수 있는 스노우플레이크 등의 공급업체에는 적합하다. 그러나 서비스 구매자는 그저 '빨리 끝내기'만 하면 되므로, 오픈소스 관련 기초 작업을 하고 싶지 않을 수 있다.

그렇다면 올슨의 2013년 선언은 잘못된 것일까. 그렇지 않다. 단, 일부 수정해야 할 수 있다. 즉 지난 10년이 아니라 ‘20년’ 동안, 오픈소스 소프트웨어로 라이선스되지 않거나 오픈소스 소프트웨어에 크게 의존하지 않는 비개방형 소스의 독점적 형태로, 지배적인 플랫폼 수준의 소프트웨어 인프라가 등장하지 않았다. editor@itworld.co.kr 



2020.09.29

칼럼 | 스노우플레이크는 오픈소스의 종말을 의미할까

Matt Asay | InfoWorld
최근 클라우드 데이터 웨어하우스 업체 스노우플레이크(Snowflake)의 기업 공개(IPO)는 큰  사건이었는데, 단순히 엄청난 가치평가 때문만은 아니었다.
 
© wezlo

2013년 클라우드 컴퓨팅 업체 클라우데라(Cloudera)의 공동 설립자인 마이크 올슨이 '엔터프라이즈 인프라의 놀랍고 돌이킬 수 없는 추세'라고 자신 있게 선언한 것이 있었다. 바로 비개방형 소스(closed-source)의 독점적 형태로는 지배적인 플랫폼이 더는 나오지 않을 주장했다. 그러나 클라우드 기반 엔터프라이즈 데이터 플랫폼인 스노우플레이크는 이런 추세, 즉 오픈소스 인프라 시대가 저물고 있음을 의미하는 것일 수 있다.

물론 빅데이터 분석 소프트웨어 업체인 스플렁크(Splunk)도 있다. 하지만 라이트스피트(Lightspeed)의 파트너 구라브 굽타에 따르면, 스플렁크는 오픈소스로 자리를 잡기 전의 사례다. 마이SQL, 아파치 하둡(Apache Hadoop), 몽고DB(MongoDB), 아파치 스파크(Apache Spark)는 모두 (적어도 초기에는) 오픈소스였다.

그리고 지금 스노우플레이크가 화제의 중심이다. 스노우플레이크는 과대평가된 것일까. 혹은 오픈소스 인프라 시대가 막바지로 치닫고 있는 것일까.
 

오픈소스의 종말?

이 질문에 대한 답은 기본적으로 이 전제를 얼마나 적극적으로 옹호할 준비가 됐는지에 따라 달라진다. 일단 모든 ‘지배적 플랫폼 수준의 소프트웨어 인프라’가 오픈소스는 아니다. 그렇지만, 지난 10~20년 동안 엔터프라이즈 인프라의 대부분이 오픈소스로 전환했다는 것은 절대적으로 사실이므로, 올슨의 핵심 주장을 반박하려는 것은 아니다.

레드햇 이머징 기술 전문가 고든 하프는 “오픈소스를 주로 사용하는 인프라는 2가지로 나눌 수 있다. 먼저 대부분의 이런 오픈소스 관련 기술은 노SQL(NoSQL), 하둡, 카프카(Kafka), 스파크(Spark), 셉(Ceph), 주피터(Jupyter) 등이다. 하지만 이런 기술을 사용하지 않는 오픈소스도 있다. 대부분 클라우드 서비스 관련된 것으로, 태블로(Tableau), 스플렁크(Splunk) 등이다”라고 말했다. 스노우플레이크 역시 후자에 속하는 것은 물론이다.

지난해 오픈소스의 활발한 활동과 성과를 보면 다소 의외로 생각하겠지만, 사실 개발자는 오픈소스에 믿음이 매우 깊은 적이 없었다. 그런데도 오픈소스가 확산하는 ‘놀라운’ 추세가 나타난 이유는 그저 오픈소스를 사용하면 쉽게 액세스할 수 있는 고품질 오픈소스 데이터 인프라 덕분에 개발자가 더 쉽게 작업할 수 있기 때문이다. 물론, 소프트웨어 스택을 더 세세하게 제어하려는 욕구와 함께, 종종 오픈소스 프로젝트에 수반되는 커뮤니티와 같은 다른 이점도 있다. 그러나 궁극적으로 오픈소스가 승리한 것은 개발자가 '작업을 쉽게 끝낼' 수 있게 해주기 때문이다.

실제로 개발자가 아파치 에어플로우(Apache Airflow)와 같은 오픈소스 소프트웨어를 사용해 독점적인 스노우플레이크 데이터 플랫폼에 데이터를 기꺼이 로드하는 이유다. 이는 인지 부조화가 아니다. 실용주의일 뿐이다.
 

매니지드 서비스로의 전환

이러한 실용주의에 대해 오픈소스 비즈니스 인텔리전스 개발자 톰 바버는 매니지드 클라우드 서비스로의 전환이 오픈소스로부터 사람들의 관심을 돌린다고 지적했다. 그는 "SaaS를 사용하면 라이선스 비용이 아니라 서비스 비용을 지불하므로, 생각이 다소 바뀐다. 결국, 오픈소스는 라이선스 비용을 지불하지 않지만, 이를 설치, 조정, 실행하려면 내부 또는 외부 전문가에게 비용을 지불해야 한다는 뜻이다. 대부분의 사람은 마이SQL을 적절하게 설치할 수 있지만, 이를 조정하려면 심층적인 지식이 필요하다”라고 말했다.

오픈소스 시장조사업체 레드몽크(Redmonk)의 애널리스트 제임스 거버너는 생각이 조금 다르다. 그는 “클라우드는 오픈소스보다 더 좋은 배포 및 패키징 메커니즘이다. 편리함에서 훨씬 앞선다. 결국은 매니지드 서비스가 이길 수밖에 없다”라고 말했다. 클라우데라의 올슨은 “나는 여전히 오픈소스 소프트웨어가 전략적 이점을 제공한다고 생각한다. 그러나 ‘더 쉬운 사용성’은 10년 전과 달리 현재의 경쟁력이 될 수 없다. 실제로 현명한 클라우드 사용자는 클라우드의 독점 인프라가 구매해 사용하기 매우 쉽다는 교훈을 이미 배웠다"라고 말했다.

이러한 지적을 종합하면 오픈소스든 아니든 상관없다는 말이 아니다. 오히려 그 반대다. 거버너는 “오픈소스는 비즈니스 모델이 아니다. 하지만 소프트웨어를 구축하고, 신뢰를 쌓고, 커뮤니티를 육성하는 좋은 방법이다”라고 말했다.

이어 “이처럼 ‘소프트웨어를 만드는 가장 좋은 방법’은 스노우플레이크와 같은 SaaS 공급업체에도 적용된다. 스노우플레이크와 같은 서비스는 오픈소스가 아닐 수 있지만, 고든 하프의 의견처럼 내부적으로 오픈소스를 적극적으로 사용하고 있다. 예를 들어, 스노우플레이크는 ‘아키텍처의 핵심 부분으로’ 오픈소스 파운데이션DB(FoundatonDB)를 사용한다. 이를 통해 놀랍고 차별화된 기능을 만들어 냈다”라고 말했다.

2019년 오픈소스 관리 솔루션 업체 화이트소스(Whitesource)의 분석에 따르면, 99%의 소프트웨어가 오픈소스를 사용한다. 이런 점에서 스노우플레이크와 오픈소스의 미래를 함께 이야기하는 것은 이번 기업 공개를 너무 좁게 해석한 것이다. 요컨대, 오픈소스는 여전히 ‘매우’ 중요하다.
 

내부에서 작동하는 오픈소스

물론 스노우플레이크와 같은 서비스 구매자에게 오픈소스가 중요한 매력이 아닐 수 있다. 켄 혼의 주장대로 스노우플레이크와 같은 서비스에는 소스 코드가 아니라 데이터가 훨씬 중요하다. 그는 “최소한 클라우드에서는 전체를 오픈소스 소프트웨어로만 구성하는 것이 적합하지 않을 수 있다"라고 말했다.

오픈소스는 오픈소스 기반 빌딩 블록의 풍부한 생태계를 구축할 수 있는 토대를 제공하므로, 데이터 웨어하우징과 기타 이런 서비스를 제공하기로 선택할 수 있는 스노우플레이크 등의 공급업체에는 적합하다. 그러나 서비스 구매자는 그저 '빨리 끝내기'만 하면 되므로, 오픈소스 관련 기초 작업을 하고 싶지 않을 수 있다.

그렇다면 올슨의 2013년 선언은 잘못된 것일까. 그렇지 않다. 단, 일부 수정해야 할 수 있다. 즉 지난 10년이 아니라 ‘20년’ 동안, 오픈소스 소프트웨어로 라이선스되지 않거나 오픈소스 소프트웨어에 크게 의존하지 않는 비개방형 소스의 독점적 형태로, 지배적인 플랫폼 수준의 소프트웨어 인프라가 등장하지 않았다. editor@itworld.co.kr 

X