Offcanvas

������������

칼럼ㅣ파이썬의 궁극적 목표는 엑셀을 대체하는 것이다

아주 흔한 스프레드시트 프로그램이 데이터 과학의 관문이라면 파이썬은 그다음 단계를 목표로 한다.    데이터 과학의 세계에는 파이토치, 텐서플로우, 파이썬, R 언어 등 오픈소스 도구가 넘쳐난다. 하지만 데이터 과학에서 가장 널리 사용되는 도구는 오픈소스가 아니다. 이는 심지어 일반적으론 데이터 과학 도구로 간주되지도 않는다.  이는 바로 당신의 노트북에서 작동 중인 ‘엑셀(Excel)’이다.    파이썬 기반 데이터 과학 플랫폼 ‘아나콘다(Anaconda)’의 CEO 피터 왕은 인터뷰를 통해 “엑셀은 호모 사피엔스 역사상 가장 성공적인 프로그래밍 시스템”이라면서, “머글(편집자 주: 해리포터 시리즈에서 처음 나온 말로, ‘일반인’이라는 의미로 쓰인다)도 이 도구를 사용할 수 있기 때문이다. 데이터를 집어넣고, 질문하며, (그리고) 모델링을 한다”라고 말했다. 간단히 말해, 엑셀을 사용하면 생산적이기 쉽다는 이야기다.  이러한 관점에서 파이썬 프로그래밍 언어에 대해 왕이 구상하는 미래는 다음과 같다. 탁월한 사용 편의성과 생산성이다. 그는 “엑셀은 오픈소스 없이 성공했지만 파이썬은 정확히 오픈소스 덕분에 성공할 것”이라고 내다봤다.  ‘빌더’에 관한 것  우리는 수년 동안 소프트웨어를 일부 회사에서 유료로 제공하는 ‘제품’으로 취급해왔다. 적어도 엔터프라이즈 세계에선 이는 결코 현실을 반영하지 않는다. 왜 그럴까? 아무리 좋은 제품이라 하더라도 고객들의 니즈를 완전히 만족시키지 못하기 때문이다. 따라서 고객들은 소프트웨어에 지불하는 비용 외에도 통합, 커스텀 등을 위한 추가 비용을 지불하게 된다. 즉, 소프트웨어는 항상 프로세스일 뿐 실제 제품이 아니다.  오픈소스에는 이 사실을 알려주는 단서가 일찌감치 있었다. 왕은 “오픈소스가 하는 일은 문을 여는 것이다. 이를테면 수리할 권리, 확장할 권리 등에 대한 문을 여는 것이다. 다시 말해, 오픈소스는 서비스형 소프트웨어(...

데이터 과학 파이썬 엑셀 스프레드시트 파이토치 텐서플로우 오픈소스 서비스형 소프트웨어 SaaS 루비 커미터 파이데이터 스택 오버플로우 사이킷런 데이터 분석

2021.06.15

아주 흔한 스프레드시트 프로그램이 데이터 과학의 관문이라면 파이썬은 그다음 단계를 목표로 한다.    데이터 과학의 세계에는 파이토치, 텐서플로우, 파이썬, R 언어 등 오픈소스 도구가 넘쳐난다. 하지만 데이터 과학에서 가장 널리 사용되는 도구는 오픈소스가 아니다. 이는 심지어 일반적으론 데이터 과학 도구로 간주되지도 않는다.  이는 바로 당신의 노트북에서 작동 중인 ‘엑셀(Excel)’이다.    파이썬 기반 데이터 과학 플랫폼 ‘아나콘다(Anaconda)’의 CEO 피터 왕은 인터뷰를 통해 “엑셀은 호모 사피엔스 역사상 가장 성공적인 프로그래밍 시스템”이라면서, “머글(편집자 주: 해리포터 시리즈에서 처음 나온 말로, ‘일반인’이라는 의미로 쓰인다)도 이 도구를 사용할 수 있기 때문이다. 데이터를 집어넣고, 질문하며, (그리고) 모델링을 한다”라고 말했다. 간단히 말해, 엑셀을 사용하면 생산적이기 쉽다는 이야기다.  이러한 관점에서 파이썬 프로그래밍 언어에 대해 왕이 구상하는 미래는 다음과 같다. 탁월한 사용 편의성과 생산성이다. 그는 “엑셀은 오픈소스 없이 성공했지만 파이썬은 정확히 오픈소스 덕분에 성공할 것”이라고 내다봤다.  ‘빌더’에 관한 것  우리는 수년 동안 소프트웨어를 일부 회사에서 유료로 제공하는 ‘제품’으로 취급해왔다. 적어도 엔터프라이즈 세계에선 이는 결코 현실을 반영하지 않는다. 왜 그럴까? 아무리 좋은 제품이라 하더라도 고객들의 니즈를 완전히 만족시키지 못하기 때문이다. 따라서 고객들은 소프트웨어에 지불하는 비용 외에도 통합, 커스텀 등을 위한 추가 비용을 지불하게 된다. 즉, 소프트웨어는 항상 프로세스일 뿐 실제 제품이 아니다.  오픈소스에는 이 사실을 알려주는 단서가 일찌감치 있었다. 왕은 “오픈소스가 하는 일은 문을 여는 것이다. 이를테면 수리할 권리, 확장할 권리 등에 대한 문을 여는 것이다. 다시 말해, 오픈소스는 서비스형 소프트웨어(...

2021.06.15

모질라, 브라우저에 파이썬 통합하는 ‘파이어다이드’ 프로젝트 분리

모질라가 ‘파이어다이드(Pyodide)’를 커뮤니티 주도의 독립 프로젝트로 분리(spin out)했다. 웹어셈블리로 컴파일된 사이썬(CPython) 3.8 인터프리터로 구성된 파이어다이드는 파이썬을 웹 브라우저에서 실행할 수 있도록 한다.    파이어다이드 프로젝트는 독립된 깃허브(GitHub) 조직에 새로운 보금자리(github.com/pyodide)를 마련했다. 공식 문서는 이곳(pyodide.org)에서 확인할 수 있다. 향후 이 프로젝트는 자원봉사로 참여하는 컨트리뷰터에 의해 유지관리될 예정이다. 이와 관련한 거버넌스 문서 그리고 파이썬 코드 성능 향상, 다운로드 크기 감소, 패키지 로딩 간소화 등의 목표를 정리한 프로젝트 로드맵이 게시됐다.   파이어다이드는 파이썬 패키지 인덱스(Python Package Index; PyPi)의 PPW(pure Python wheel)로 모든 파이썬 패키지를 설치할 수 있다. 또 파이어다이드에는 파이썬 패키지를 자바스크립트에 노출하고, DOM을 포함한 브라우저 UI를 파이썬에 노출하는 외부 함수 인터페이스가 있다.  이 밖에도 해당 프로젝트는 넘파이(NumPy), 판다(Panda), 맷플롯립(Matplotlib), 사이파이(SciPy), 사이킷런(Scikit-learn) 등의 많은 파이썬 과학 패키지를 브라우저에서 실행할 수 있도록 지원한다. 개발자는 브라우저의 REPL(Read Eval Print Loop)에서 파이어다이드를 사용해볼 수 있다.  모질라는 지난 4월 22일 이 프로젝트의 독립을 발표하는 한편 주요 유지관리 개선, 중앙 API 재설계, 오류 및 메모리 누수 제거 등을 특징으로 하는 파이어다이드 0.17 릴리즈도 출시했다.  본래 브라우저에서 데이터 과학을 지원하는 아이오다이드(Iodide) 프로젝트에서 파이썬을 사용할 수 있도록 모질라 내부에서 개발됐던 파이어다이드는 큰 관심을 끌었으며, 현재 모질라 외부의 많은 프로젝트에서 사용되고 있...

모질라 파이어다이드 파이썬 데이터 과학 사이썬 깃허브 넘파이 판다 맷플롯립 사이파이 사이킷런 브라우저 아이오다이드 러스트 웹 개발 오픈소스

2021.04.26

모질라가 ‘파이어다이드(Pyodide)’를 커뮤니티 주도의 독립 프로젝트로 분리(spin out)했다. 웹어셈블리로 컴파일된 사이썬(CPython) 3.8 인터프리터로 구성된 파이어다이드는 파이썬을 웹 브라우저에서 실행할 수 있도록 한다.    파이어다이드 프로젝트는 독립된 깃허브(GitHub) 조직에 새로운 보금자리(github.com/pyodide)를 마련했다. 공식 문서는 이곳(pyodide.org)에서 확인할 수 있다. 향후 이 프로젝트는 자원봉사로 참여하는 컨트리뷰터에 의해 유지관리될 예정이다. 이와 관련한 거버넌스 문서 그리고 파이썬 코드 성능 향상, 다운로드 크기 감소, 패키지 로딩 간소화 등의 목표를 정리한 프로젝트 로드맵이 게시됐다.   파이어다이드는 파이썬 패키지 인덱스(Python Package Index; PyPi)의 PPW(pure Python wheel)로 모든 파이썬 패키지를 설치할 수 있다. 또 파이어다이드에는 파이썬 패키지를 자바스크립트에 노출하고, DOM을 포함한 브라우저 UI를 파이썬에 노출하는 외부 함수 인터페이스가 있다.  이 밖에도 해당 프로젝트는 넘파이(NumPy), 판다(Panda), 맷플롯립(Matplotlib), 사이파이(SciPy), 사이킷런(Scikit-learn) 등의 많은 파이썬 과학 패키지를 브라우저에서 실행할 수 있도록 지원한다. 개발자는 브라우저의 REPL(Read Eval Print Loop)에서 파이어다이드를 사용해볼 수 있다.  모질라는 지난 4월 22일 이 프로젝트의 독립을 발표하는 한편 주요 유지관리 개선, 중앙 API 재설계, 오류 및 메모리 누수 제거 등을 특징으로 하는 파이어다이드 0.17 릴리즈도 출시했다.  본래 브라우저에서 데이터 과학을 지원하는 아이오다이드(Iodide) 프로젝트에서 파이썬을 사용할 수 있도록 모질라 내부에서 개발됐던 파이어다이드는 큰 관심을 끌었으며, 현재 모질라 외부의 많은 프로젝트에서 사용되고 있...

2021.04.26

10년 후, 데이터 과학자 사라진다?··· ‘오토ML’로 싹 달라진다!

‘오토ML(AutoML)’은 개발자를 데이터 과학자로 바꿀 준비가 돼 있다. 반대 경우도 마찬가지다. 오토ML이 데이터 과학을 어떻게 더 나은 방향으로 변화시키는 걸까? 앞으로 10년 후에는, 현재 우리가 알고 있는 데이터 과학자가 없어질 것이다. 일자리가 사라질 걱정은 할 필요 없다. 데이터 과학자들도 걱정할 필요는 없다. 하는 일이 달라지는 것이기 때문이다. 오히려 미국 노동부(Bureau of Labor) 통계에 따르면 데이터 과학자의 역할은 2029년까지 평균보다 더 높은 속도로 확대될 전망이다.    설명하자면, 기술 발전으로 인해 데이터 과학자의 업무와 기업이 애널리틱스에 접근하는 방식에 큰 변화가 초래될 것으로 예상된다. 원시 데이터부터 모델까지 머신러닝 파이프라인을 자동화하는 오토ML 도구가 이러한 혁신적인 변화를 견인한다.  이에 따라 데이터 과학자들은 10년 후 완전히 다른 기술과 도구를 갖게 될 가능성이 크다. 그러나 복잡한 데이터를 활용해 비즈니스 문제를 해결할 수 있도록 지원하는 전문 가이드라는 점은 여전할 것이다. 데이터 과학을 ‘민주화’ 하는 오토ML 최근까지도 머신러닝 알고리즘과 프로세스는 거의 전적으로 전통적인 데이터 과학자, 즉 전문 교육을 받고 고급 학위를 취득했거나 또는 대규모 기술 기업에서 일하는 사람들만 다룰 수 있는 영역이었다. 데이터 과학자들은 머신러닝 개발 스펙트럼의 모든 부분에서 매우 중요한 일들을 해왔다.  하지만 머지않아 데이터 과학자들은 더욱더 협력적이고 전략적인 역할로 변화할 전망이다. 오토ML과 같은 도구를 사용해 학문적인 이론 및 기술을 자동화함으로써, 기업이 데이터를 통해 비즈니스 문제를 해결할 수 있도록 솔루션을 ‘가이드’하는 데 집중할 수 있다는 뜻이다.  이는 오토ML이 머신러닝 모델 구축을 ‘민주화’하기 때문에 가능한 부분이다. 이미 시장에서는 스타트업부터 클라우드 하이퍼 스케일러까지 여러 업체가 개발자를 대상으로 전문 교육이나 경험 측면...

데이터 과학 데이터 과학자 오토ML 개발자 시민 데이터 과학자 머신러닝 애널리틱스 AWS 마이크로소프트 애저 데이터 사이킷런 텐서플로우 파이토치

2020.11.20

‘오토ML(AutoML)’은 개발자를 데이터 과학자로 바꿀 준비가 돼 있다. 반대 경우도 마찬가지다. 오토ML이 데이터 과학을 어떻게 더 나은 방향으로 변화시키는 걸까? 앞으로 10년 후에는, 현재 우리가 알고 있는 데이터 과학자가 없어질 것이다. 일자리가 사라질 걱정은 할 필요 없다. 데이터 과학자들도 걱정할 필요는 없다. 하는 일이 달라지는 것이기 때문이다. 오히려 미국 노동부(Bureau of Labor) 통계에 따르면 데이터 과학자의 역할은 2029년까지 평균보다 더 높은 속도로 확대될 전망이다.    설명하자면, 기술 발전으로 인해 데이터 과학자의 업무와 기업이 애널리틱스에 접근하는 방식에 큰 변화가 초래될 것으로 예상된다. 원시 데이터부터 모델까지 머신러닝 파이프라인을 자동화하는 오토ML 도구가 이러한 혁신적인 변화를 견인한다.  이에 따라 데이터 과학자들은 10년 후 완전히 다른 기술과 도구를 갖게 될 가능성이 크다. 그러나 복잡한 데이터를 활용해 비즈니스 문제를 해결할 수 있도록 지원하는 전문 가이드라는 점은 여전할 것이다. 데이터 과학을 ‘민주화’ 하는 오토ML 최근까지도 머신러닝 알고리즘과 프로세스는 거의 전적으로 전통적인 데이터 과학자, 즉 전문 교육을 받고 고급 학위를 취득했거나 또는 대규모 기술 기업에서 일하는 사람들만 다룰 수 있는 영역이었다. 데이터 과학자들은 머신러닝 개발 스펙트럼의 모든 부분에서 매우 중요한 일들을 해왔다.  하지만 머지않아 데이터 과학자들은 더욱더 협력적이고 전략적인 역할로 변화할 전망이다. 오토ML과 같은 도구를 사용해 학문적인 이론 및 기술을 자동화함으로써, 기업이 데이터를 통해 비즈니스 문제를 해결할 수 있도록 솔루션을 ‘가이드’하는 데 집중할 수 있다는 뜻이다.  이는 오토ML이 머신러닝 모델 구축을 ‘민주화’하기 때문에 가능한 부분이다. 이미 시장에서는 스타트업부터 클라우드 하이퍼 스케일러까지 여러 업체가 개발자를 대상으로 전문 교육이나 경험 측면...

2020.11.20

한눈에 보자!··· 최신 데이터 애널리틱스 동향 15선

빅데이터, 머신러닝, 데이터 과학… 데이터 애널리틱스 혁명이 숨가쁘게 진화하고 있다. 기업으로서는 자사의 BA/BI 전문가와 데이터 과학자가 최신 기술과 전략 트렌드에 대응하도록 대비해야 할 상황이다. 데이터 분석이 IT의 핵심에 빠르게 자리잡고 있다. 빅데이터, 머신러닝, 딥러닝, 데이터 과학 등 방대한 양의 데이터 분석을 위한 기술과 기법의 범위가 빠른 속도로 확장되고 있다. 고객 행동, 시스템 성능, 새로운 수익 창출 기회에 대한 심도 있는 통찰을 얻기 위한 데이터 분석 전략은 최신 데이터 분석 트렌드를 확실히 꿰고 있을 때 그 효과가 더 커진다. 현재 인기 상승 중인 데이터 분석 기술과 기법 및 전략과 한 때 잘나갔지만 인기가 식기 시작한 데이터 분석 트렌드를 소개한다. 비즈니스 분석가에서부터 데이터 과학자는 물론, 경영진과 실무진까지 감안할 만한 내용이다. 인기 상승: 셀프서비스 BI 인기 상승: 모바일 대시보드 인기 하락: 하둡 인기 상승: R 언어 인기 상승: 심층 신경망 인기 하락: IoT 인기 상승: 텐서플로우 인기 상승: 믹스넷(MXNet) 인기 하락: 배치 분석(Batch analysis) 인기 상승: 마이크로소프트 인지 툴킷 2.0 인기 상승: 사이킷런(Scikit-learn) 인기 하락: 카페(Caffe) 인기 상승: 주피터 노트북(Jupyter Notebooks) 인기 상승: 클라우드 스토리지 및 분석 인기 하락: 월간 BI 보고서 인기 상승: 셀프서비스 BI 대상: BI/BA 전문가, 경영자 태블로(Tableau), 클릭 센스(Qlik Sense), 파워 비아이(Power BI), 도모(Domo)와 같은 셀프서비스 BI 도구를 이용함으로써 경영자는 원하는 최신 비즈니스 정보를 그래픽 형태로 얻을 수 있다. 처음 시작할 때, 그리고 데이터 소스를 추가할 때, 어느 정도 IT의 도움이 필요하지만 데이터 정...

하둡 주피터 노트북 믹스넷 심층 신경망 카페 텐서플로우 R 애널리틱스 대시보드 데이터 분석 사이킷런

2017.08.09

빅데이터, 머신러닝, 데이터 과학… 데이터 애널리틱스 혁명이 숨가쁘게 진화하고 있다. 기업으로서는 자사의 BA/BI 전문가와 데이터 과학자가 최신 기술과 전략 트렌드에 대응하도록 대비해야 할 상황이다. 데이터 분석이 IT의 핵심에 빠르게 자리잡고 있다. 빅데이터, 머신러닝, 딥러닝, 데이터 과학 등 방대한 양의 데이터 분석을 위한 기술과 기법의 범위가 빠른 속도로 확장되고 있다. 고객 행동, 시스템 성능, 새로운 수익 창출 기회에 대한 심도 있는 통찰을 얻기 위한 데이터 분석 전략은 최신 데이터 분석 트렌드를 확실히 꿰고 있을 때 그 효과가 더 커진다. 현재 인기 상승 중인 데이터 분석 기술과 기법 및 전략과 한 때 잘나갔지만 인기가 식기 시작한 데이터 분석 트렌드를 소개한다. 비즈니스 분석가에서부터 데이터 과학자는 물론, 경영진과 실무진까지 감안할 만한 내용이다. 인기 상승: 셀프서비스 BI 인기 상승: 모바일 대시보드 인기 하락: 하둡 인기 상승: R 언어 인기 상승: 심층 신경망 인기 하락: IoT 인기 상승: 텐서플로우 인기 상승: 믹스넷(MXNet) 인기 하락: 배치 분석(Batch analysis) 인기 상승: 마이크로소프트 인지 툴킷 2.0 인기 상승: 사이킷런(Scikit-learn) 인기 하락: 카페(Caffe) 인기 상승: 주피터 노트북(Jupyter Notebooks) 인기 상승: 클라우드 스토리지 및 분석 인기 하락: 월간 BI 보고서 인기 상승: 셀프서비스 BI 대상: BI/BA 전문가, 경영자 태블로(Tableau), 클릭 센스(Qlik Sense), 파워 비아이(Power BI), 도모(Domo)와 같은 셀프서비스 BI 도구를 이용함으로써 경영자는 원하는 최신 비즈니스 정보를 그래픽 형태로 얻을 수 있다. 처음 시작할 때, 그리고 데이터 소스를 추가할 때, 어느 정도 IT의 도움이 필요하지만 데이터 정...

2017.08.09

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.8