Offcanvas

AI / 개발자 / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스

칼럼ㅣ파이썬의 궁극적 목표는 엑셀을 대체하는 것이다

2021.06.15 Matt Asay  |  InfoWorld
아주 흔한 스프레드시트 프로그램이 데이터 과학의 관문이라면 파이썬은 그다음 단계를 목표로 한다.   

데이터 과학의 세계에는 파이토치, 텐서플로우, 파이썬, R 언어 등 오픈소스 도구가 넘쳐난다. 하지만 데이터 과학에서 가장 널리 사용되는 도구는 오픈소스가 아니다. 이는 심지어 일반적으론 데이터 과학 도구로 간주되지도 않는다. 

이는 바로 당신의 노트북에서 작동 중인 ‘엑셀(Excel)’이다. 
 
ⓒGetty Images

파이썬 기반 데이터 과학 플랫폼 ‘아나콘다(Anaconda)’의 CEO 피터 왕은 인터뷰를 통해 “엑셀은 호모 사피엔스 역사상 가장 성공적인 프로그래밍 시스템”이라면서, “머글(편집자 주: 해리포터 시리즈에서 처음 나온 말로, ‘일반인’이라는 의미로 쓰인다)도 이 도구를 사용할 수 있기 때문이다. 데이터를 집어넣고, 질문하며, (그리고) 모델링을 한다”라고 말했다. 간단히 말해, 엑셀을 사용하면 생산적이기 쉽다는 이야기다. 

이러한 관점에서 파이썬 프로그래밍 언어에 대해 왕이 구상하는 미래는 다음과 같다. 탁월한 사용 편의성과 생산성이다. 그는 “엑셀은 오픈소스 없이 성공했지만 파이썬은 정확히 오픈소스 덕분에 성공할 것”이라고 내다봤다. 

‘빌더’에 관한 것 
우리는 수년 동안 소프트웨어를 일부 회사에서 유료로 제공하는 ‘제품’으로 취급해왔다. 적어도 엔터프라이즈 세계에선 이는 결코 현실을 반영하지 않는다. 왜 그럴까? 아무리 좋은 제품이라 하더라도 고객들의 니즈를 완전히 만족시키지 못하기 때문이다. 따라서 고객들은 소프트웨어에 지불하는 비용 외에도 통합, 커스텀 등을 위한 추가 비용을 지불하게 된다. 즉, 소프트웨어는 항상 프로세스일 뿐 실제 제품이 아니다. 

오픈소스에는 이 사실을 알려주는 단서가 일찌감치 있었다. 왕은 “오픈소스가 하는 일은 문을 여는 것이다. 이를테면 수리할 권리, 확장할 권리 등에 대한 문을 여는 것이다. 다시 말해, 오픈소스는 서비스형 소프트웨어(SaaS)라는 개념을 하나의 프로세스로 수용한다”라고 설명했다. 

더 중요한 건 이것이 의미하는 바다. 이를 통해 더 많은 사람이 오픈소스를 구축하고 성공시키는 데 참여하도록 장려한다는 것을 뜻하기 때문이다. 대부분 소프트웨어의 경우 90~95%의 사용자가 제작 프로세스에서 제외된다고 왕은 추정했다. 

이런 상황에서 사용자들은 데모를 볼 수도 있지만 다른 사람이 자신을 대신해 소프트웨어 가치를 제공할 것이라고 믿고 있다. “반면에 데이터 과학을 위한 오픈소스는 완전히 새로운 범주의 사용자가 메이커와 빌더로 바뀌었기 때문에 매우 성공적이었다”라고 그는 덧붙였다. 

--> 블로그ㅣ‘파이썬’이 데이터 과학을 집어삼키고 있다

물론 대부분의 사람은 파이썬 스크립트를 작성하지 않는다. 하지만 파이썬은 일반 사람이 데이터 과학을 훨씬 쉽게 할 수 있도록 했으며, 이는 데이터 과학에서 파이썬이 성공을 거둔 가장 큰 이유다. 

왕은 “개인적으로 파이썬의 궁극적인 목표는 루비(Ruby)나 펄(Perl) 또는 다른 프로그래밍 언어를 물리치는 게 아니라 일반 사용자를 위한 데이터 과학 도구로 엑셀을 대체하는 것”이라면서, “나는 파이썬과 파이데이터를 엑셀의 개념적 후계자로 밀고 있다”라고 말했다. 
 
미래 재구성하기 
그곳으로 어떻게 갈 수 있을까? 그에 따르면 오픈소스 커뮤니티가 핵심이며, 이는 코드를 커밋할 수 있는 커뮤니티에만 국한되지 않는다. 이어서 왕은 “파이썬엔 리믹스 문화, 학습 문화, 교육 문화가 있다”라고 덧붙였다. 

코드도 중요하다. 왕은 “커미터가 (다른 사람이 그 위에 구축할 수 있는) 토대를 마련하기 때문이다. 특정 사용자 계층과 사용자 대면 API를 유지하고 이에 관한 안정성을 제공함으로써 전체적으로 더 높은 수준의 기여가 나타나고 번성할 수 있다”라고 전했다. 하지만 이것만으론 충분하지 않다. 

또 다른 기여가 많다. 왕은 “이를테면 스택 오버플로우(Stack Overflow) 관련 질문에 대답하는 모든 사람과 사이킷런(Scikit-learn)으로 학습시킨 모델에 대해 블로그 게시물을 작성하는 모든 사람도 (데이터 분석 작업을 시작한 지 2~3년밖에 안 됐을 수도 있지만) 다른 사람이 참여할 수 있는 길을 열어주고 있다”라고 설명했다. 

이게 한 회사가 특정 제품을 미는 ‘엑셀’ 혁신 모델보다 나은가? 왕은 분명하게 그렇다고 말했다. 그는 “일반적으로 속도를 늦추더라도 다른 사람과 함께 일하는 것이 그냥 앉아서 혼자 일하는 것보다 더 나은 결과를 이끌어 낸다”라고 말했다. 

최종적으로는 커뮤니티가 엑셀보다 더 접근하기 쉽고 더 광범위하게 적용할 수 있는 ‘엑셀’을 개발해 데이터 과학을 영원히 바꾸길 희망한다고 왕은 전했다. 

* Matt Asay는 인포월드에 기고하는 기술 전문 저술가다. ciokr@idg.co.kr

 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.