Offcanvas

개발자 / 머신러닝|딥러닝 / 애플리케이션

머신러닝 맞춤 정복···파이썬 배포판 5종 따라잡기

2018.06.15 Serdar Yegulalp  |  InfoWorld


즉 머신러닝 또는 데이터 과학 프로젝트를 위해 파이썬 환경을 맞춤 구성하고 스스로를 신뢰하며 제 3자 변경사항의 방해를 받고 싶지 않다면 C파이썬이 좋다. C파이썬의 소스는 바로 사용할 수 있기 때문에, 속도 또는 프로젝트 필요를 위해 원하는 변경사항을 맞춤 컴파일할 수도 있다.

한편, C파이썬을 사용하면 NumPy 같은 패키지의 설치와 구성의 입/출력과 함께 모든 의존성(일부는 수동으로 찾아서 추가해야 한다)을 처리해야 한다.

파이썬의 Pip 패키지 관리자가 여러 데이터 과학 패키지에서 사용하는 종류의 사전 컴파일 바이너리를 설치하기 때문에 이 작업 중 일부는 지난 수 년 동안 부담이 감소했다. 하지만 마이크로소프트의 윈도우 등에서는 C/C++ 컴파일러를 수동으로 설치하는 등 모든 것을 직접 구성해야 하는 경우가 많다.

C파이썬을 사용할 때의 또 다른 단점은 인텔의 MKL 확장기능처럼 머신러닝과 데이터 과학에서 유용한 성능 가속화 옵션을 전혀 사용하지 않는다는 점이다. 인텔 MKL을 사용하려면 스스로 NumPy와 SciPy 라이브러리를 구축해야 한다.

엔쏘우트 캐노피(Enthought Canopy)
파이썬의 엔쏘우트 캐노피 배포판은 많은 면에서 아나콘다를 닮았다. 주된 사용처로 데이터 과학과 머신러닝을 감안해 구성되었으며 자체적으로 조율된 패키지 인덱스가 제공되고 전체 구성 관리를 위한 그래픽 전단과 명령줄 툴을 제공한다.

또 기업 사용자는 방화벽 이면의 패키지 관리 시스템인 EDS(Enthought Deployment Server)를 구매할 수 있다. 캐노피용으로 구축된 머신러닝 패키지는 인텔 MKL 확장기능을 사용한다.

아나콘다와 캐노피의 주된 차이점은 범위이다. 캐노피가 단정한 편이라면 아나콘다는 좀더 포괄적이다. 예를 들어, 캐노피에는 파이썬 가상 환경 생성 및 관리를 위한 명령줄 툴이 포함되어 있지만(다양한 머신러닝 워크플로를 위해 다양한 패키지를 처리할 때 유용하다.) 아나콘다는 이 작업을 위한 GUI를 제공한다. 한편, 캐노피에도 파일 브라우저, 주피터 메모, 코드 편집기가 조합된 편리한 IDE가 내장되어 있어 바로 작업을 시작할 수 있다.

윈파이썬(WinPython)
본래 윈파이썬의 목적은 마이크로소프트 윈도우 전용으로 구축된 파이썬 에디션을 제공하는 것이었다. 윈도우용 C파이썬 빌드가 특별히 탄탄하지 않을 당시에는 윈파이썬이 그 틈새를 메웠다. 현재 C파이썬의 윈도우 에디션은 꽤 훌륭하며 윈파이썬은 특히 데이터 과학과 머신러닝 애플리케이션 등 C파이썬의 부족한 점을 보완하는 쪽으로 전향했다.

기본적으로 윈파이썬은 포터블이다. 윈파이썬 배포판 전체가 어느 곳에서나 실행할 수 있는 하나의 디렉터리에 들어간다. 윈파이썬 설치는 일정 작업에 필요한 모든 환경 변수, 패키지, 스크립트가 설치된 하나의 아카이브(Archive) 또는 USB 드라이브로 제공될 수 있다. 특정 모델을 훈련하거나 특정 데이터 실험을 재현하기 위해 필요한 모든 것을 통합하는 유용한 방법이다. 또는 윈도우에 윈파이썬 설치를 등록하여 네이티브(Native) 상태로 설치된 것처럼 실행할 수 있다(그리고 나중에 원한다면 등록을 해제할 수 있다).

원파이썬은 머신러닝 중심적인 파이썬 배포판의 여러 까다로운 요소를 모두 아우른다. NumPy, 판다스, 주피터, R과 줄리아(Julia) 언어의 인터페이스 같은 핵심 라이브러리의 대부분은 기본적으로 포함되어 있으며 적절한 곳에서 인텔 MKL 확장기능에 대항하여 구축된다. Mingw64 C/C++ 컴파일러도 윈파이썬에서는 NumPy와 패키지로 제공되기 때문에 컴파일러를 설치하지 않고 바이너리 파이썬 확장기능을 소스로부터 구축할 수 있다(싸이썬 사용 등).

윈파이썬에는 사전 구축 바이너리뿐만이 아니라 순수한 파이썬 패키지와 함께 제공되는 패키지를 처리하는 자체 패키지 설치 프로그램인 WPPM이 있다. 그리고 기본적으로 패키지가 포함되지 않은 윈파이썬의 베어본(Bare-bone) 버전을 원하는 경우를 감안해 윈파이썬은 아나콘다의 미니콘다와 마찬가지로 "제로 버전"을 제공한다. ciokr@idg.co.kr 

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.