2018.06.15

머신러닝 맞춤 정복···파이썬 배포판 5종 따라잡기

Serdar Yegulalp | InfoWorld

통계, 데이터 과학, 머신러닝 등의 분야에 종사하고 있다면 파이썬(Python)을 사용하고 있을 확률이 높다. 그럴만한 이유가 있다. 풍부한 라이브러리와 관련 두고 생태계 그리고 언어 자체의 편리함을 갖춘 파이썬은 훌륭한 선택이다.

하지만 파이썬에는 여러 배포판이 존재하며 각각 다른 대상자를 위해 개발됐다. 오늘은 포괄적인 것부터 구체적인 것까지 5가지 파이썬 버전과 이들 각각이 머신러닝 작업 처리를 위해 어떻게 구축되는지에 대한 세부사항을 살펴본다.


파이썬은 시스템 자동화부터 머신러닝 등의 첨단 분야에서의 작업까지 여러 작업을 간소화한다.

아나콘다 파이썬(Anaconda Python)
아나콘다는 데이터 과학과 머신러닝 뿐 아니라 일반 용도의 개발을 위한 배포판으로써 두각을 나타내고 있다. 아나콘다는 기업을 위한 지원 계획을 제공하는 같은 이름의 상용 제공처(종전 이름은 컨티넘 어낼리틱스(Continuum Analytics))의 지원을 받는다.

아나콘다 배포판은 데이터 과학에서 자주 사용하는 NumPy, 판다스(Pandas), Matplotlib 등의 패키지에 손쉽게 액세스할 수 있게 해준다. 아나콘다와 쉽게 묶이는 것은 아니지만 콘다(Conda)라는 사용자 정의 패키지 관리 시스템을 통해 사용 가능하다.

콘다 설치 패키지는 파이썬의 자체 Pip를 통해 관리할 수 없는 까다로운 외부 바이너리 의존성이 포함될 수 있다. (원한다면 Pip를 사용할 수 있지만 콘다가 이런 패키지에 제공하는 이점은 누릴 수 없을 것이다.) 각 패키지는 아나콘다에 의해 최신 상태로 유지되며 그 중 상당수는 속도를 위해 인텔MKL(Math Kernel Library) 확장기능으로 컴파일 된다.

아나콘다가 제공하는 다른 주요 이점으로는 그래픽 환경인 아나콘다 내비게이터(Anaconda Navigator)가 있다. 내비게이터는 IDE가 아니지만 콘다 패키지 관리자와 사용자 구성 가상 환경을 포함해 아나콘다 기능을 위한 편리한 GUI 모음이다. 또한 내비게이터를 이용해 주피터(Jupyter) 메모와 비주얼 스튜디오 코드(Visual Studio Code) IDE 등 제 3자 애플리케이션을 관리할 수 있다.

아나콘다의 최소 설치 형태인 미니콘다(Miniconda)는 시작하기에 충분한 기본 아나콘다를 설치한다. 그러면서도 필요에 따라 다른 콘다 또는 Pip 설치 패키지를 통해 확장할 수 있다. 아나콘다의 풍부한 라이브러리 전체를 활용하고 싶을 때 유용하다. 단 간소하게 유지할 필요가 있다.

액티브파이썬(ActivePython)
데이터 과학은 파이썬 언어의 전문적인 지원 버전으로써 개발된 액티브파이썬(ActivePython)의 사용례 중 하나에 불과하다. 아키텍처와 플랫폼에서 일관되게 이행되는 액티브파이썬은 AIX, HP-UX, 솔라리스(Solaris) 뿐 아니라 윈도우, 리눅스, 맥OS 등의 플랫폼에서 데이터 과학을 위해 파이썬을 사용하는 경우에도 도움이 된다.

액티브파이썬은 파이썬의 원본 참조 버전에 가능한 가깝게 유지하기 위해 노력하고 있다. 복잡한 수학 및 통계 패키지를 위한 특수 설치 프로그램(아나콘다의 접근방식) 대신에 액티브파이썬은 필요 시 인텔 MKL 확장기능을 이용해 여러 패키지를 사전에 컴파일하고 액티브파이썬의 기본 설치를 통해 팩인(Pack-in)으로 제공한다. 형식적으로 설치할 필요가 없으며 처음부터 바로 사용할 수 있다.

하지만 이런 사전 컴파일된 패키지의 새 버전으로 업그레이드하고 싶다면 다음 액티브파이썬 빌드 자체가 공개될 때까지 기다려야 한다. 이 때문에 액티브파이썬 전체가 좀 더 일관되지만(결과의 재현성이 중요할 때 중요하다.) 유연성이 떨어진다.

C파이썬(CPython)
공식적이고 순수한 파이썬 버전을 이용해 머신러닝 작업을 처음부터 시작하고 싶다면 C파이썬을 검토할 만하다. 이름에서 알 수 있듯이 C로 작성된 파이썬 런타임(Runtime)의 기준 에디션인 C파이썬은 파이썬소프트웨어재단(Python Software Foundation)의 웹사이트에서 제공되며 파이썬 스크립트를 실행하고 패키지를 관리하기 위해 필요한 툴만 제공한다.




2018.06.15

머신러닝 맞춤 정복···파이썬 배포판 5종 따라잡기

Serdar Yegulalp | InfoWorld

통계, 데이터 과학, 머신러닝 등의 분야에 종사하고 있다면 파이썬(Python)을 사용하고 있을 확률이 높다. 그럴만한 이유가 있다. 풍부한 라이브러리와 관련 두고 생태계 그리고 언어 자체의 편리함을 갖춘 파이썬은 훌륭한 선택이다.

하지만 파이썬에는 여러 배포판이 존재하며 각각 다른 대상자를 위해 개발됐다. 오늘은 포괄적인 것부터 구체적인 것까지 5가지 파이썬 버전과 이들 각각이 머신러닝 작업 처리를 위해 어떻게 구축되는지에 대한 세부사항을 살펴본다.


파이썬은 시스템 자동화부터 머신러닝 등의 첨단 분야에서의 작업까지 여러 작업을 간소화한다.

아나콘다 파이썬(Anaconda Python)
아나콘다는 데이터 과학과 머신러닝 뿐 아니라 일반 용도의 개발을 위한 배포판으로써 두각을 나타내고 있다. 아나콘다는 기업을 위한 지원 계획을 제공하는 같은 이름의 상용 제공처(종전 이름은 컨티넘 어낼리틱스(Continuum Analytics))의 지원을 받는다.

아나콘다 배포판은 데이터 과학에서 자주 사용하는 NumPy, 판다스(Pandas), Matplotlib 등의 패키지에 손쉽게 액세스할 수 있게 해준다. 아나콘다와 쉽게 묶이는 것은 아니지만 콘다(Conda)라는 사용자 정의 패키지 관리 시스템을 통해 사용 가능하다.

콘다 설치 패키지는 파이썬의 자체 Pip를 통해 관리할 수 없는 까다로운 외부 바이너리 의존성이 포함될 수 있다. (원한다면 Pip를 사용할 수 있지만 콘다가 이런 패키지에 제공하는 이점은 누릴 수 없을 것이다.) 각 패키지는 아나콘다에 의해 최신 상태로 유지되며 그 중 상당수는 속도를 위해 인텔MKL(Math Kernel Library) 확장기능으로 컴파일 된다.

아나콘다가 제공하는 다른 주요 이점으로는 그래픽 환경인 아나콘다 내비게이터(Anaconda Navigator)가 있다. 내비게이터는 IDE가 아니지만 콘다 패키지 관리자와 사용자 구성 가상 환경을 포함해 아나콘다 기능을 위한 편리한 GUI 모음이다. 또한 내비게이터를 이용해 주피터(Jupyter) 메모와 비주얼 스튜디오 코드(Visual Studio Code) IDE 등 제 3자 애플리케이션을 관리할 수 있다.

아나콘다의 최소 설치 형태인 미니콘다(Miniconda)는 시작하기에 충분한 기본 아나콘다를 설치한다. 그러면서도 필요에 따라 다른 콘다 또는 Pip 설치 패키지를 통해 확장할 수 있다. 아나콘다의 풍부한 라이브러리 전체를 활용하고 싶을 때 유용하다. 단 간소하게 유지할 필요가 있다.

액티브파이썬(ActivePython)
데이터 과학은 파이썬 언어의 전문적인 지원 버전으로써 개발된 액티브파이썬(ActivePython)의 사용례 중 하나에 불과하다. 아키텍처와 플랫폼에서 일관되게 이행되는 액티브파이썬은 AIX, HP-UX, 솔라리스(Solaris) 뿐 아니라 윈도우, 리눅스, 맥OS 등의 플랫폼에서 데이터 과학을 위해 파이썬을 사용하는 경우에도 도움이 된다.

액티브파이썬은 파이썬의 원본 참조 버전에 가능한 가깝게 유지하기 위해 노력하고 있다. 복잡한 수학 및 통계 패키지를 위한 특수 설치 프로그램(아나콘다의 접근방식) 대신에 액티브파이썬은 필요 시 인텔 MKL 확장기능을 이용해 여러 패키지를 사전에 컴파일하고 액티브파이썬의 기본 설치를 통해 팩인(Pack-in)으로 제공한다. 형식적으로 설치할 필요가 없으며 처음부터 바로 사용할 수 있다.

하지만 이런 사전 컴파일된 패키지의 새 버전으로 업그레이드하고 싶다면 다음 액티브파이썬 빌드 자체가 공개될 때까지 기다려야 한다. 이 때문에 액티브파이썬 전체가 좀 더 일관되지만(결과의 재현성이 중요할 때 중요하다.) 유연성이 떨어진다.

C파이썬(CPython)
공식적이고 순수한 파이썬 버전을 이용해 머신러닝 작업을 처음부터 시작하고 싶다면 C파이썬을 검토할 만하다. 이름에서 알 수 있듯이 C로 작성된 파이썬 런타임(Runtime)의 기준 에디션인 C파이썬은 파이썬소프트웨어재단(Python Software Foundation)의 웹사이트에서 제공되며 파이썬 스크립트를 실행하고 패키지를 관리하기 위해 필요한 툴만 제공한다.


X