Offcanvas

������������

딥러닝 프레임워크 ‘3파전’··· '텐서플로우 vs 파이토치 vs JAX' 비교

오늘날 딥러닝 연구 및 개발을 주도하는 3가지 프레임워크가 있다. 각각 (1) 사용 편의성, (2) 기능 및 성숙도, (3) 엄청난 확장성으로 유명하다. 어떤 프레임워크를 사용해야 할까?  음성에 반응하는 시리나 알렉사, 스마트폰의 실시간 번역 앱, 스마트 트랙터, 창고 로봇, 자율주행차 등에 들어가는 컴퓨터 비전 기술 등 ‘딥러닝’은 크고 작은 방식으로 삶을 매일 변화시키고 있다. 그리고 거의 모든 딥러닝 애플리케이션은 3가지 프레임워크 (1) 텐서플로우, (2) 파이토치, (3) JAM 중 하나로 작성된다. 그렇다면 이 중에서 어떤 딥러닝 프레임워크를 사용해야 할까?    ‘텐서플로우’를 사용해야 할까? 1970년대와 1980년대에는 ‘IBM 제품을 샀다고 해고된 사람은 아무도 없다(Nobody ever got fired forbuying an IBM)’라는 말이 진리로 통했다. 2010년대에는 이를 ‘딥러닝에 텐서플로우를 사용했다고 해고된 사람은 아무도 없다’라고 바꿔 말할 수 있겠다. 하지만 주지하다시피 IBM은 1990년대에 접어들면서 도태됐다. 그렇다면 텐서플로우는 2015년 처음 공개된 지 7년이 지난 지금에도 여전히 경쟁력이 있을까? 확실히 그렇다. 텐서플로우가 그동안 가만히 있지 않았다. 텐서플로우 1.x는 파이썬과 매우 다른 방식으로 정적 그래프를 작성하는 게 전부였지만 텐서플로우 2.x는 ‘즉시 실행’ 모드를 사용한 모델 빌드가 가능해지면서 좀 더 파이토치 같은 느낌이 났다. 아울러 하이 레벨(high level)에서 텐서플로우는 더 쉬운 개발을 위해 케라스(Keras)를 제공하고, 로우 레벨에서는 속도를 위해 컴파일러를 최적화하는 XLA(Accelerated Linear Algebra)를 제공한다. XLA는 GPU 성능을 향상시키며, 대규모 모델 학습에 뛰어난 성능을 제공하는 구글의 TPU(Tensor Processing Units)를 활용하는 방법이기도 하다. 그리고 텐서플로우가 수년간 잘해...

딥러닝 머신러닝 인공지능 개발 라이브러리 개발 프레임워크 소프트웨어 개발 파이썬 텐서플로우 파이토치 JAX 케라스 넘파이

2022.08.31

오늘날 딥러닝 연구 및 개발을 주도하는 3가지 프레임워크가 있다. 각각 (1) 사용 편의성, (2) 기능 및 성숙도, (3) 엄청난 확장성으로 유명하다. 어떤 프레임워크를 사용해야 할까?  음성에 반응하는 시리나 알렉사, 스마트폰의 실시간 번역 앱, 스마트 트랙터, 창고 로봇, 자율주행차 등에 들어가는 컴퓨터 비전 기술 등 ‘딥러닝’은 크고 작은 방식으로 삶을 매일 변화시키고 있다. 그리고 거의 모든 딥러닝 애플리케이션은 3가지 프레임워크 (1) 텐서플로우, (2) 파이토치, (3) JAM 중 하나로 작성된다. 그렇다면 이 중에서 어떤 딥러닝 프레임워크를 사용해야 할까?    ‘텐서플로우’를 사용해야 할까? 1970년대와 1980년대에는 ‘IBM 제품을 샀다고 해고된 사람은 아무도 없다(Nobody ever got fired forbuying an IBM)’라는 말이 진리로 통했다. 2010년대에는 이를 ‘딥러닝에 텐서플로우를 사용했다고 해고된 사람은 아무도 없다’라고 바꿔 말할 수 있겠다. 하지만 주지하다시피 IBM은 1990년대에 접어들면서 도태됐다. 그렇다면 텐서플로우는 2015년 처음 공개된 지 7년이 지난 지금에도 여전히 경쟁력이 있을까? 확실히 그렇다. 텐서플로우가 그동안 가만히 있지 않았다. 텐서플로우 1.x는 파이썬과 매우 다른 방식으로 정적 그래프를 작성하는 게 전부였지만 텐서플로우 2.x는 ‘즉시 실행’ 모드를 사용한 모델 빌드가 가능해지면서 좀 더 파이토치 같은 느낌이 났다. 아울러 하이 레벨(high level)에서 텐서플로우는 더 쉬운 개발을 위해 케라스(Keras)를 제공하고, 로우 레벨에서는 속도를 위해 컴파일러를 최적화하는 XLA(Accelerated Linear Algebra)를 제공한다. XLA는 GPU 성능을 향상시키며, 대규모 모델 학습에 뛰어난 성능을 제공하는 구글의 TPU(Tensor Processing Units)를 활용하는 방법이기도 하다. 그리고 텐서플로우가 수년간 잘해...

2022.08.31

칼럼ㅣ파이썬의 궁극적 목표는 엑셀을 대체하는 것이다

아주 흔한 스프레드시트 프로그램이 데이터 과학의 관문이라면 파이썬은 그다음 단계를 목표로 한다.    데이터 과학의 세계에는 파이토치, 텐서플로우, 파이썬, R 언어 등 오픈소스 도구가 넘쳐난다. 하지만 데이터 과학에서 가장 널리 사용되는 도구는 오픈소스가 아니다. 이는 심지어 일반적으론 데이터 과학 도구로 간주되지도 않는다.  이는 바로 당신의 노트북에서 작동 중인 ‘엑셀(Excel)’이다.    파이썬 기반 데이터 과학 플랫폼 ‘아나콘다(Anaconda)’의 CEO 피터 왕은 인터뷰를 통해 “엑셀은 호모 사피엔스 역사상 가장 성공적인 프로그래밍 시스템”이라면서, “머글(편집자 주: 해리포터 시리즈에서 처음 나온 말로, ‘일반인’이라는 의미로 쓰인다)도 이 도구를 사용할 수 있기 때문이다. 데이터를 집어넣고, 질문하며, (그리고) 모델링을 한다”라고 말했다. 간단히 말해, 엑셀을 사용하면 생산적이기 쉽다는 이야기다.  이러한 관점에서 파이썬 프로그래밍 언어에 대해 왕이 구상하는 미래는 다음과 같다. 탁월한 사용 편의성과 생산성이다. 그는 “엑셀은 오픈소스 없이 성공했지만 파이썬은 정확히 오픈소스 덕분에 성공할 것”이라고 내다봤다.  ‘빌더’에 관한 것  우리는 수년 동안 소프트웨어를 일부 회사에서 유료로 제공하는 ‘제품’으로 취급해왔다. 적어도 엔터프라이즈 세계에선 이는 결코 현실을 반영하지 않는다. 왜 그럴까? 아무리 좋은 제품이라 하더라도 고객들의 니즈를 완전히 만족시키지 못하기 때문이다. 따라서 고객들은 소프트웨어에 지불하는 비용 외에도 통합, 커스텀 등을 위한 추가 비용을 지불하게 된다. 즉, 소프트웨어는 항상 프로세스일 뿐 실제 제품이 아니다.  오픈소스에는 이 사실을 알려주는 단서가 일찌감치 있었다. 왕은 “오픈소스가 하는 일은 문을 여는 것이다. 이를테면 수리할 권리, 확장할 권리 등에 대한 문을 여는 것이다. 다시 말해, 오픈소스는 서비스형 소프트웨어(...

데이터 과학 파이썬 엑셀 스프레드시트 파이토치 텐서플로우 오픈소스 서비스형 소프트웨어 SaaS 루비 커미터 파이데이터 스택 오버플로우 사이킷런 데이터 분석

2021.06.15

아주 흔한 스프레드시트 프로그램이 데이터 과학의 관문이라면 파이썬은 그다음 단계를 목표로 한다.    데이터 과학의 세계에는 파이토치, 텐서플로우, 파이썬, R 언어 등 오픈소스 도구가 넘쳐난다. 하지만 데이터 과학에서 가장 널리 사용되는 도구는 오픈소스가 아니다. 이는 심지어 일반적으론 데이터 과학 도구로 간주되지도 않는다.  이는 바로 당신의 노트북에서 작동 중인 ‘엑셀(Excel)’이다.    파이썬 기반 데이터 과학 플랫폼 ‘아나콘다(Anaconda)’의 CEO 피터 왕은 인터뷰를 통해 “엑셀은 호모 사피엔스 역사상 가장 성공적인 프로그래밍 시스템”이라면서, “머글(편집자 주: 해리포터 시리즈에서 처음 나온 말로, ‘일반인’이라는 의미로 쓰인다)도 이 도구를 사용할 수 있기 때문이다. 데이터를 집어넣고, 질문하며, (그리고) 모델링을 한다”라고 말했다. 간단히 말해, 엑셀을 사용하면 생산적이기 쉽다는 이야기다.  이러한 관점에서 파이썬 프로그래밍 언어에 대해 왕이 구상하는 미래는 다음과 같다. 탁월한 사용 편의성과 생산성이다. 그는 “엑셀은 오픈소스 없이 성공했지만 파이썬은 정확히 오픈소스 덕분에 성공할 것”이라고 내다봤다.  ‘빌더’에 관한 것  우리는 수년 동안 소프트웨어를 일부 회사에서 유료로 제공하는 ‘제품’으로 취급해왔다. 적어도 엔터프라이즈 세계에선 이는 결코 현실을 반영하지 않는다. 왜 그럴까? 아무리 좋은 제품이라 하더라도 고객들의 니즈를 완전히 만족시키지 못하기 때문이다. 따라서 고객들은 소프트웨어에 지불하는 비용 외에도 통합, 커스텀 등을 위한 추가 비용을 지불하게 된다. 즉, 소프트웨어는 항상 프로세스일 뿐 실제 제품이 아니다.  오픈소스에는 이 사실을 알려주는 단서가 일찌감치 있었다. 왕은 “오픈소스가 하는 일은 문을 여는 것이다. 이를테면 수리할 권리, 확장할 권리 등에 대한 문을 여는 것이다. 다시 말해, 오픈소스는 서비스형 소프트웨어(...

2021.06.15

칼럼ㅣMS 빌드 2021에서 어쩌면 놓쳤을지도 모를 것들

마이크로소프트의 연례 개발자 컨퍼런스 ‘빌드(Build)’ 2021은 48시간 동안 수많은 내용을 발표했다. 중요하지만 어쩌면 놓쳤을지도 모를 소식들을 정리했다.   마이크로소프트의 연례 개발자 컨퍼런스 ‘빌드’에서는 3가지 주요 개발자 플랫폼(닷넷(.NET) 및 윈도우(Windows), 애저(Azure), 파워 플랫폼(Power Platform))에 걸친 최신 기술과 서비스가 대거 공개되고, 여러 지식 공유 및 학습 기회가 제공된다.  이 밖에 프리뷰로 공개됐던 것이 GA로 전환되고, 기존 플랫폼과 서비스에 새 기능이 추가되는 등 뉴스가 항상 많다. 아울러 개발자 전략과 제품 로드맵이 간략히 소개되는 등 마이크로소프트의 큰 그림을 엿볼 수 있기도 하다.    올해의 주요 발표 내용은 무엇이었을까? 애저 데이터 플랫폼 관련 업데이트는 이미 살펴봤으니(해당 기사 참조) 이번 글에서는 경험이 많은 코더이든 아니면 처음 로우코드 개발 도구를 사용한 사람이든 상관없이 마이크로소프트 플랫폼에서 애플리케이션을 개발하는 사람이라면 누구에게나 가장 중요하다고 생각되는 소식들을 간단하게 살펴봤다.  한편 빌드 2021에서 가장 큰 비중을 차지한 애저는 클라우드 네이티브 개발 도구와 머신러닝에 중점을 두고 애저 아크(Azure Arc)와 애저 스택(Azure Stack)을 통해 하이브리드 클라우드 구축에/으로 애저 서비스를 가져오면서 마이크로소프트의 최신 개발 전략 핵심 요소라는 위치를 확고히 했다. 파이토치를 지원하는 머신러닝(ML) 애저 머신러닝(Azure ML) 관련 발표 가운데 가장 흥미로웠던 내용은 파이토치 엔터프라이즈(PyTorch Enterprise)의 지원 빌드가 공개된 것이다.  원래 페이스북에서 개발했지만 현재는 다양한 조직(마이크로소프트의 자체 ML 제품 개발을 지원하는 조직 포함)에서 사용 중인 파이토치는 자체 추론 런타임을 쓰거나 (윈도우에서 사용하기 위해) 모델을 오픈 뉴럴 네트워크 익스...

마이크로소프트 빌드 빌드 2021 개발자 컨퍼런스 윈도우 닷넷 애저 파워플랫폼 머신러닝 파이토치 로우코드 노코드 클라우드 ARM 퀄컴 인공지능

2021.06.04

마이크로소프트의 연례 개발자 컨퍼런스 ‘빌드(Build)’ 2021은 48시간 동안 수많은 내용을 발표했다. 중요하지만 어쩌면 놓쳤을지도 모를 소식들을 정리했다.   마이크로소프트의 연례 개발자 컨퍼런스 ‘빌드’에서는 3가지 주요 개발자 플랫폼(닷넷(.NET) 및 윈도우(Windows), 애저(Azure), 파워 플랫폼(Power Platform))에 걸친 최신 기술과 서비스가 대거 공개되고, 여러 지식 공유 및 학습 기회가 제공된다.  이 밖에 프리뷰로 공개됐던 것이 GA로 전환되고, 기존 플랫폼과 서비스에 새 기능이 추가되는 등 뉴스가 항상 많다. 아울러 개발자 전략과 제품 로드맵이 간략히 소개되는 등 마이크로소프트의 큰 그림을 엿볼 수 있기도 하다.    올해의 주요 발표 내용은 무엇이었을까? 애저 데이터 플랫폼 관련 업데이트는 이미 살펴봤으니(해당 기사 참조) 이번 글에서는 경험이 많은 코더이든 아니면 처음 로우코드 개발 도구를 사용한 사람이든 상관없이 마이크로소프트 플랫폼에서 애플리케이션을 개발하는 사람이라면 누구에게나 가장 중요하다고 생각되는 소식들을 간단하게 살펴봤다.  한편 빌드 2021에서 가장 큰 비중을 차지한 애저는 클라우드 네이티브 개발 도구와 머신러닝에 중점을 두고 애저 아크(Azure Arc)와 애저 스택(Azure Stack)을 통해 하이브리드 클라우드 구축에/으로 애저 서비스를 가져오면서 마이크로소프트의 최신 개발 전략 핵심 요소라는 위치를 확고히 했다. 파이토치를 지원하는 머신러닝(ML) 애저 머신러닝(Azure ML) 관련 발표 가운데 가장 흥미로웠던 내용은 파이토치 엔터프라이즈(PyTorch Enterprise)의 지원 빌드가 공개된 것이다.  원래 페이스북에서 개발했지만 현재는 다양한 조직(마이크로소프트의 자체 ML 제품 개발을 지원하는 조직 포함)에서 사용 중인 파이토치는 자체 추론 런타임을 쓰거나 (윈도우에서 사용하기 위해) 모델을 오픈 뉴럴 네트워크 익스...

2021.06.04

블로그ㅣ‘파이썬’이 데이터 과학을 집어삼키고 있다

데이터 과학에서 파이썬의 우세가 갈수록 R 언어로 기울어지리라 예상했다. 하지만 그 예측은 빗나갔다.    지난 2015년 필자는 한 칼럼'(In data science, the R language is swallowing Python)'을 기고했다. 그리고 “데이터 과학에서 파이썬의 우세가 갈수록 R 언어로 기울어질 것”이라고 예상한 바 있다. 예측은 빗나갔다.  최근 데이터 과학자 겸 애널리스트 테렌스 신이 1만 5,000개 이상의 데이터 과학자 채용 공고를 분석한 결과에서 볼 수 있듯이, 실제로는 R 언어 채택 비율이 감소하고 있는 반면에 파이썬을 쓰는 비율은 계속해서 증가하고 있다. 물론 이게 데이터 과학자들이 조만간 R을 사용하지 않을 것이란 의미는 아니다. 아마도 각각의 장점에 따라 파이썬과 R을 모두 사용하게 될 가능성이 크다.  그렇긴 하지만 만약 인포월드(InfoWorld) 기자 닉 엘프린의 예측이 맞고 (그의 말처럼) ‘2021년은 데이터 과학이 모든 업무 및 부서에 영향을 미치는 전사적인 역량이 될 한 해’라면 지배적인 위치를 차지할 언어는 기업 내에서 가장 많은 사람이 접근할 수 있는 언어일 것이다.  ‘파이썬’의 압승이다.  데이터 과학 붐의 동력 다음의 ‘2021년 가장 필요한 데이터 과학 기술 톱 10’ 차트를 보면 뭔가 익숙하게 느껴질 것이다. 데이터 과학자 제프 헤일이 지난 2019년에 공개했던 분석 결과와 상당히 유사하기 때문이다. 좀 더 자세히 살펴보면 몇 가지 동향을 파악할 수 있다. 아래와 같다.       • 클라우드 관련 기술의 중요성이 많이 증가하고 있다.  • 마찬가지로 파이썬 및 텐서플로우 등의 딥러닝 관련 기술의 중요성도 크게 증가하고 있다.  • SQL과 파이썬의 중요성은 계속 증가하고 있지만 R은 정체 상태다.  • 하둡(Hadoop), 하이브(Hive), 스파크(Spark) 등...

데이터 과학 파이썬 R 언어 텐서플로우 파이토치

2021.04.21

데이터 과학에서 파이썬의 우세가 갈수록 R 언어로 기울어지리라 예상했다. 하지만 그 예측은 빗나갔다.    지난 2015년 필자는 한 칼럼'(In data science, the R language is swallowing Python)'을 기고했다. 그리고 “데이터 과학에서 파이썬의 우세가 갈수록 R 언어로 기울어질 것”이라고 예상한 바 있다. 예측은 빗나갔다.  최근 데이터 과학자 겸 애널리스트 테렌스 신이 1만 5,000개 이상의 데이터 과학자 채용 공고를 분석한 결과에서 볼 수 있듯이, 실제로는 R 언어 채택 비율이 감소하고 있는 반면에 파이썬을 쓰는 비율은 계속해서 증가하고 있다. 물론 이게 데이터 과학자들이 조만간 R을 사용하지 않을 것이란 의미는 아니다. 아마도 각각의 장점에 따라 파이썬과 R을 모두 사용하게 될 가능성이 크다.  그렇긴 하지만 만약 인포월드(InfoWorld) 기자 닉 엘프린의 예측이 맞고 (그의 말처럼) ‘2021년은 데이터 과학이 모든 업무 및 부서에 영향을 미치는 전사적인 역량이 될 한 해’라면 지배적인 위치를 차지할 언어는 기업 내에서 가장 많은 사람이 접근할 수 있는 언어일 것이다.  ‘파이썬’의 압승이다.  데이터 과학 붐의 동력 다음의 ‘2021년 가장 필요한 데이터 과학 기술 톱 10’ 차트를 보면 뭔가 익숙하게 느껴질 것이다. 데이터 과학자 제프 헤일이 지난 2019년에 공개했던 분석 결과와 상당히 유사하기 때문이다. 좀 더 자세히 살펴보면 몇 가지 동향을 파악할 수 있다. 아래와 같다.       • 클라우드 관련 기술의 중요성이 많이 증가하고 있다.  • 마찬가지로 파이썬 및 텐서플로우 등의 딥러닝 관련 기술의 중요성도 크게 증가하고 있다.  • SQL과 파이썬의 중요성은 계속 증가하고 있지만 R은 정체 상태다.  • 하둡(Hadoop), 하이브(Hive), 스파크(Spark) 등...

2021.04.21

텐서플로우에서 파이토치로··· 기업 3곳의 이유 있는 전환

머신러닝의 하위 범주인 딥 러닝은 다중 계층 신경망을 사용해서 이미지 인식, 자연어 처리(NLP), 기계 번역 같이 전통적으로 어려운 기계 작업을 대규모로 자동화한다.   2015년에 구글에서 탄생한 텐서플로우는 학계와 기업 양쪽 모두에서 가장 인기 있는 오픈소스 딥 러닝 프레임워크다. 그러나 2016년 2월에 등장한 파이토치(PyTorch)가 커뮤니티의 주도로 다양한 사용 사례에 대한 사용 및 배포 편의성을 개선하면서 빠른 속도로 따라잡고 있다.       파이토치는 특히 자동차 업계에서 활발하게 도입되어 테슬라, 리프트 레벨 5(Lyft Level 5)와 같은 자율 운전 시스템 파일럿에 적용되고 있다. 또한 미디어 기업에서 콘텐츠 분류와 추천에 사용되고 산업 애플리케이션에서 로봇을 지원하는 용도로도 사용된다.     페이스북 AI의 인공지능 부문 제품 책임자인 조 스피삭은 인포월드와의 인터뷰에서 기업의 파이토치 도입 증가는 반가운 일이지만 더 폭넓은 업계 도입을 이끌기 위해서는 해야 할 일이 여전히 많다고 말했다.   스피삭은 “라이프사이클 관리, ML옵스, 쿠브플로우(Kubeflow) 파이프라인과 이를 중심으로 한 커뮤니티가 활성화되어야 도입 범위를 한층 더 넓힐 수 있다”면서 “여정의 초기에 있는 기업에는 좋은 툴이다. 관리형 서비스와 오픈소스, 그리고 애저 ML이나 AWS에서 세이지메이커(SageMaker at AWS) 등을 사용해 시작할 수 있다”고 말했다.   디즈니의 애니메이션 내 얼굴 식별 사례 미디어 공룡 디즈니의 엔지니어와 데이터 과학자는 2012년부터 콘텐트 지놈(Content Genome)을 구축하고 있다. 콘텐츠 지놈은 디즈니의 방대한 콘텐트 라이브러리 전반에서 콘텐츠 메타데이터를 조합해 머신러닝 기반 검색과 개인화 애플리케이션을 실행하는 지식 그래프다.   디즈니 개발자 미구엘 앙겔 파레, 앤서니 아카르도, 마크 주니엔트, 모니카 알파로와 세스...

텐서플로우 파이토치

2020.12.07

머신러닝의 하위 범주인 딥 러닝은 다중 계층 신경망을 사용해서 이미지 인식, 자연어 처리(NLP), 기계 번역 같이 전통적으로 어려운 기계 작업을 대규모로 자동화한다.   2015년에 구글에서 탄생한 텐서플로우는 학계와 기업 양쪽 모두에서 가장 인기 있는 오픈소스 딥 러닝 프레임워크다. 그러나 2016년 2월에 등장한 파이토치(PyTorch)가 커뮤니티의 주도로 다양한 사용 사례에 대한 사용 및 배포 편의성을 개선하면서 빠른 속도로 따라잡고 있다.       파이토치는 특히 자동차 업계에서 활발하게 도입되어 테슬라, 리프트 레벨 5(Lyft Level 5)와 같은 자율 운전 시스템 파일럿에 적용되고 있다. 또한 미디어 기업에서 콘텐츠 분류와 추천에 사용되고 산업 애플리케이션에서 로봇을 지원하는 용도로도 사용된다.     페이스북 AI의 인공지능 부문 제품 책임자인 조 스피삭은 인포월드와의 인터뷰에서 기업의 파이토치 도입 증가는 반가운 일이지만 더 폭넓은 업계 도입을 이끌기 위해서는 해야 할 일이 여전히 많다고 말했다.   스피삭은 “라이프사이클 관리, ML옵스, 쿠브플로우(Kubeflow) 파이프라인과 이를 중심으로 한 커뮤니티가 활성화되어야 도입 범위를 한층 더 넓힐 수 있다”면서 “여정의 초기에 있는 기업에는 좋은 툴이다. 관리형 서비스와 오픈소스, 그리고 애저 ML이나 AWS에서 세이지메이커(SageMaker at AWS) 등을 사용해 시작할 수 있다”고 말했다.   디즈니의 애니메이션 내 얼굴 식별 사례 미디어 공룡 디즈니의 엔지니어와 데이터 과학자는 2012년부터 콘텐트 지놈(Content Genome)을 구축하고 있다. 콘텐츠 지놈은 디즈니의 방대한 콘텐트 라이브러리 전반에서 콘텐츠 메타데이터를 조합해 머신러닝 기반 검색과 개인화 애플리케이션을 실행하는 지식 그래프다.   디즈니 개발자 미구엘 앙겔 파레, 앤서니 아카르도, 마크 주니엔트, 모니카 알파로와 세스...

2020.12.07

10년 후, 데이터 과학자 사라진다?··· ‘오토ML’로 싹 달라진다!

‘오토ML(AutoML)’은 개발자를 데이터 과학자로 바꿀 준비가 돼 있다. 반대 경우도 마찬가지다. 오토ML이 데이터 과학을 어떻게 더 나은 방향으로 변화시키는 걸까? 앞으로 10년 후에는, 현재 우리가 알고 있는 데이터 과학자가 없어질 것이다. 일자리가 사라질 걱정은 할 필요 없다. 데이터 과학자들도 걱정할 필요는 없다. 하는 일이 달라지는 것이기 때문이다. 오히려 미국 노동부(Bureau of Labor) 통계에 따르면 데이터 과학자의 역할은 2029년까지 평균보다 더 높은 속도로 확대될 전망이다.    설명하자면, 기술 발전으로 인해 데이터 과학자의 업무와 기업이 애널리틱스에 접근하는 방식에 큰 변화가 초래될 것으로 예상된다. 원시 데이터부터 모델까지 머신러닝 파이프라인을 자동화하는 오토ML 도구가 이러한 혁신적인 변화를 견인한다.  이에 따라 데이터 과학자들은 10년 후 완전히 다른 기술과 도구를 갖게 될 가능성이 크다. 그러나 복잡한 데이터를 활용해 비즈니스 문제를 해결할 수 있도록 지원하는 전문 가이드라는 점은 여전할 것이다. 데이터 과학을 ‘민주화’ 하는 오토ML 최근까지도 머신러닝 알고리즘과 프로세스는 거의 전적으로 전통적인 데이터 과학자, 즉 전문 교육을 받고 고급 학위를 취득했거나 또는 대규모 기술 기업에서 일하는 사람들만 다룰 수 있는 영역이었다. 데이터 과학자들은 머신러닝 개발 스펙트럼의 모든 부분에서 매우 중요한 일들을 해왔다.  하지만 머지않아 데이터 과학자들은 더욱더 협력적이고 전략적인 역할로 변화할 전망이다. 오토ML과 같은 도구를 사용해 학문적인 이론 및 기술을 자동화함으로써, 기업이 데이터를 통해 비즈니스 문제를 해결할 수 있도록 솔루션을 ‘가이드’하는 데 집중할 수 있다는 뜻이다.  이는 오토ML이 머신러닝 모델 구축을 ‘민주화’하기 때문에 가능한 부분이다. 이미 시장에서는 스타트업부터 클라우드 하이퍼 스케일러까지 여러 업체가 개발자를 대상으로 전문 교육이나 경험 측면...

데이터 과학 데이터 과학자 오토ML 개발자 시민 데이터 과학자 머신러닝 애널리틱스 AWS 마이크로소프트 애저 데이터 사이킷런 텐서플로우 파이토치

2020.11.20

‘오토ML(AutoML)’은 개발자를 데이터 과학자로 바꿀 준비가 돼 있다. 반대 경우도 마찬가지다. 오토ML이 데이터 과학을 어떻게 더 나은 방향으로 변화시키는 걸까? 앞으로 10년 후에는, 현재 우리가 알고 있는 데이터 과학자가 없어질 것이다. 일자리가 사라질 걱정은 할 필요 없다. 데이터 과학자들도 걱정할 필요는 없다. 하는 일이 달라지는 것이기 때문이다. 오히려 미국 노동부(Bureau of Labor) 통계에 따르면 데이터 과학자의 역할은 2029년까지 평균보다 더 높은 속도로 확대될 전망이다.    설명하자면, 기술 발전으로 인해 데이터 과학자의 업무와 기업이 애널리틱스에 접근하는 방식에 큰 변화가 초래될 것으로 예상된다. 원시 데이터부터 모델까지 머신러닝 파이프라인을 자동화하는 오토ML 도구가 이러한 혁신적인 변화를 견인한다.  이에 따라 데이터 과학자들은 10년 후 완전히 다른 기술과 도구를 갖게 될 가능성이 크다. 그러나 복잡한 데이터를 활용해 비즈니스 문제를 해결할 수 있도록 지원하는 전문 가이드라는 점은 여전할 것이다. 데이터 과학을 ‘민주화’ 하는 오토ML 최근까지도 머신러닝 알고리즘과 프로세스는 거의 전적으로 전통적인 데이터 과학자, 즉 전문 교육을 받고 고급 학위를 취득했거나 또는 대규모 기술 기업에서 일하는 사람들만 다룰 수 있는 영역이었다. 데이터 과학자들은 머신러닝 개발 스펙트럼의 모든 부분에서 매우 중요한 일들을 해왔다.  하지만 머지않아 데이터 과학자들은 더욱더 협력적이고 전략적인 역할로 변화할 전망이다. 오토ML과 같은 도구를 사용해 학문적인 이론 및 기술을 자동화함으로써, 기업이 데이터를 통해 비즈니스 문제를 해결할 수 있도록 솔루션을 ‘가이드’하는 데 집중할 수 있다는 뜻이다.  이는 오토ML이 머신러닝 모델 구축을 ‘민주화’하기 때문에 가능한 부분이다. 이미 시장에서는 스타트업부터 클라우드 하이퍼 스케일러까지 여러 업체가 개발자를 대상으로 전문 교육이나 경험 측면...

2020.11.20

김진철의 How-to-Big Data | 빅데이터의 미래 (12)

빅데이터 비즈니스 트렌드의 미래로서 사이버 물리 시스템 기반의 지능형 서비스 비즈니스를 꽤 오랜 지면을 할애해서 지난 1년간 살펴보고 있다. 이번 글은 인공지능 기술과 사이버 물리 시스템 사이의 관계, 미래를 살펴보는 마지막 글로, 지난 6월 13일 자 “이코노미스트(The Economist)”지에 실린 “계간 기술(Technology Quarterly)” 특집 기사의 내용을 같이 살펴보면서 앞으로 인공지능 기술이 어떤 양상으로 발전하게 될지 같이 엿보려고 한다. 지난 6월 13일 자 “이코노미스트(The Economist)”지의 “계간 기술(Technology Quarterly)”은 아직도 그 열기가 가시지 않고 있는 인공지능 기술에 대한 특집 기사로 채워졌다. 권위 있는 경제 매체인 “이코노미스트(The Economist)”지는 매 분기별로 글로벌 경제에 영향을 미치는 기술 이슈들을 주제별로 선정해 심도 있게 조사, 분석하여 소개하는 “계간 기술(Technology Quarterly)” 특집 기사를 정기적으로 싣고 있다.   “이코노미스트(The Economist)”지는 “네이처(Nature)”나 “사이언스(Science)”와 같은 전문 과학기술 학술 저널, “MIT 기술 리뷰(MIT Technology Review)”나 “와이어드(Wired)”와 같은 전문 기술 매체가 아닌 경제 전문 매체임에도 불구하고, 정확하고 균형 있는 조사와 분석을 통해 최근 기술의 발전 동향이 경제에 미치는 영향과 효과를 현실적이고 정확하게 소개해왔다. 이번 6월 13일 자의 “계간 기술(Technology Quarterly)” 특집 기사는 지난 5년간 전 지구를 뜨겁게 달구어 왔던 인공지능 기술을 주제로 하였다. 이번 6월 13일 자 “계간 기술(Technology Quarterly)” 특집 기사의 핵심 주제는 “인공지능 기술의 가을이 오고 있다(AI’s autumn is coming)”라는 한 문장으로 요약될 수 있다. 지금까지 주목받고 많은 이슈를 몰고 온 ...

빅데이터 사이버 물리 시스템 인공지능 AI 머신러닝 딥러닝 이코노미스트 가트너 알파고 엔비디아 마이크로소프트 구글 페이스북 챗봇 가상 비서 지능형 서비스 GM 하둡 스파크 텐서플로우 파이토치 디지털 전환 디지털 트랜스포메이션 4차 산업혁명 데이터 댐 아마존 해석가능한 인공지능 XAI

2020.10.30

빅데이터 비즈니스 트렌드의 미래로서 사이버 물리 시스템 기반의 지능형 서비스 비즈니스를 꽤 오랜 지면을 할애해서 지난 1년간 살펴보고 있다. 이번 글은 인공지능 기술과 사이버 물리 시스템 사이의 관계, 미래를 살펴보는 마지막 글로, 지난 6월 13일 자 “이코노미스트(The Economist)”지에 실린 “계간 기술(Technology Quarterly)” 특집 기사의 내용을 같이 살펴보면서 앞으로 인공지능 기술이 어떤 양상으로 발전하게 될지 같이 엿보려고 한다. 지난 6월 13일 자 “이코노미스트(The Economist)”지의 “계간 기술(Technology Quarterly)”은 아직도 그 열기가 가시지 않고 있는 인공지능 기술에 대한 특집 기사로 채워졌다. 권위 있는 경제 매체인 “이코노미스트(The Economist)”지는 매 분기별로 글로벌 경제에 영향을 미치는 기술 이슈들을 주제별로 선정해 심도 있게 조사, 분석하여 소개하는 “계간 기술(Technology Quarterly)” 특집 기사를 정기적으로 싣고 있다.   “이코노미스트(The Economist)”지는 “네이처(Nature)”나 “사이언스(Science)”와 같은 전문 과학기술 학술 저널, “MIT 기술 리뷰(MIT Technology Review)”나 “와이어드(Wired)”와 같은 전문 기술 매체가 아닌 경제 전문 매체임에도 불구하고, 정확하고 균형 있는 조사와 분석을 통해 최근 기술의 발전 동향이 경제에 미치는 영향과 효과를 현실적이고 정확하게 소개해왔다. 이번 6월 13일 자의 “계간 기술(Technology Quarterly)” 특집 기사는 지난 5년간 전 지구를 뜨겁게 달구어 왔던 인공지능 기술을 주제로 하였다. 이번 6월 13일 자 “계간 기술(Technology Quarterly)” 특집 기사의 핵심 주제는 “인공지능 기술의 가을이 오고 있다(AI’s autumn is coming)”라는 한 문장으로 요약될 수 있다. 지금까지 주목받고 많은 이슈를 몰고 온 ...

2020.10.30

김진철의 How-to-Big Data | 빅데이터의 미래 (11)

지난 글에서는 정부가 1조 94억 원의 대규모 예산을 투입해서 앞으로 10년간 개발한다고 하는 PIM 방식의 인공지능 반도체 기술이 어떤 것인지, 왜 이 인공지능 반도체 기술이 중요한지 기술적인 측면에서 같이 살펴보았다. 지난 글에서도 언급했듯이, PIM 방식의 인공지능 반도체 기술은 그 자체로는 인공지능 기술이 아니며, 현재 인공지능 모델에서 가장 많이 사용되는 연산인 그래프 연산과 텐서 연산의 성능 향상과 가속에 효과적인 프로세서라고 소개했다. 대규모 그래프 연산과 텐서 연산에 효과적인 아키텍처로서 채택된 “프로세서-인-메모리(Processor-In-Memory)” 아키텍처는 실제 연산을 수행하는 프로세서 코어들을 하나의 프로세서에 가능한 한 많이 집적하면서도, 딥러닝 같은 기계 학습 알고리즘의 학습(training)과 추론(inference)을 수행할 때 대용량 데이터들이 프로세서 코어 사이에서 원활하게 교환될 수 있도록 메모리 타일 위에 프로세서 코어를 배치한다. 이렇게 배치된 이 프로세서-메모리 타일 간에 격자 형태로 고대역폭 데이터 교환 패브릭을 배치하여 어떤 프로세서 코어 사이에도 프로세서 코어 간 대칭적으로 데이터 교환이 가능하게끔 만든 아키텍처이다.   이 PIM 방식의 인공지능 프로세서로 최근 가장 유망하게 떠오르고 있는 두 가지의 인공지능 프로세서 제품을 살펴보았다. 그래프코어(Graphcore)사의 IPU(Intelligence Processing Unit; IPU)는 그래프 형태로 기술된 연산을 병렬로 처리하기에 최적화된 아키텍처를 가지고 있으며, 인공지능뿐만 아닌 그래프 빅데이터의 처리에도 적합한 아키텍처를 가지고 있다. 그래프코어사의 IPU와 이를 탑재하는 서버인 델(Dell)의 DSS8440 서버, 포플라(Poplar) 그래프 컴퓨팅 소프트웨어 스택이 한데 어우러져 인공지능과 빅데이터 연산에 최적화된 솔루션을 제공할 수 있도록 기술이 구성되어 있다고 소개했다. 그래프코어(Graphcore)사의 IPU와 함께 ...

김진철 빅데이터 인공지능 머신러닝 딥러닝 파이토치 텐서플로우 요슈아 벤지오 신견망 페이스북 구글

2020.09.28

지난 글에서는 정부가 1조 94억 원의 대규모 예산을 투입해서 앞으로 10년간 개발한다고 하는 PIM 방식의 인공지능 반도체 기술이 어떤 것인지, 왜 이 인공지능 반도체 기술이 중요한지 기술적인 측면에서 같이 살펴보았다. 지난 글에서도 언급했듯이, PIM 방식의 인공지능 반도체 기술은 그 자체로는 인공지능 기술이 아니며, 현재 인공지능 모델에서 가장 많이 사용되는 연산인 그래프 연산과 텐서 연산의 성능 향상과 가속에 효과적인 프로세서라고 소개했다. 대규모 그래프 연산과 텐서 연산에 효과적인 아키텍처로서 채택된 “프로세서-인-메모리(Processor-In-Memory)” 아키텍처는 실제 연산을 수행하는 프로세서 코어들을 하나의 프로세서에 가능한 한 많이 집적하면서도, 딥러닝 같은 기계 학습 알고리즘의 학습(training)과 추론(inference)을 수행할 때 대용량 데이터들이 프로세서 코어 사이에서 원활하게 교환될 수 있도록 메모리 타일 위에 프로세서 코어를 배치한다. 이렇게 배치된 이 프로세서-메모리 타일 간에 격자 형태로 고대역폭 데이터 교환 패브릭을 배치하여 어떤 프로세서 코어 사이에도 프로세서 코어 간 대칭적으로 데이터 교환이 가능하게끔 만든 아키텍처이다.   이 PIM 방식의 인공지능 프로세서로 최근 가장 유망하게 떠오르고 있는 두 가지의 인공지능 프로세서 제품을 살펴보았다. 그래프코어(Graphcore)사의 IPU(Intelligence Processing Unit; IPU)는 그래프 형태로 기술된 연산을 병렬로 처리하기에 최적화된 아키텍처를 가지고 있으며, 인공지능뿐만 아닌 그래프 빅데이터의 처리에도 적합한 아키텍처를 가지고 있다. 그래프코어사의 IPU와 이를 탑재하는 서버인 델(Dell)의 DSS8440 서버, 포플라(Poplar) 그래프 컴퓨팅 소프트웨어 스택이 한데 어우러져 인공지능과 빅데이터 연산에 최적화된 솔루션을 제공할 수 있도록 기술이 구성되어 있다고 소개했다. 그래프코어(Graphcore)사의 IPU와 함께 ...

2020.09.28

오라클, 자바 머신러닝 라이브러리 ‘트리뷰오’ 오픈소스로 공개

‘트리뷰오(Tribuo)’는 텐서플로우(TensorFlow), 엑스지부스트(XGBoost), ONNX(Open Neural Network Exchange)를 위한 인터페이스와 함께 자바로 분류, 클러스터링, 회귀 모델을 구축하고 배포하는 툴을 제공한다.  15일(현지 시각) 오라클이 자바 머신러닝 라이브러리 ‘트리뷰오(Tribuo)’를 오픈소스 라이선스로 무료 제공한다고 발표했다. 머신러닝과 관련한 기업들의 니즈를 충족시키기 위해서다.     오라클의 목표는 트리뷰오를 통해 자바에서 머신러닝 모델을 더욱더 쉽게 구축하고 배포하도록 하는 것이다. 아파치 2.0(Apache 2.0) 라이선스 기반 오픈소스이며, 오라클 랩스(Oracle Labs)가 개발한 트리뷰오는 현재 기트허브(GitHub) 및 메이븐 센트럴(Maven Central)에서 액세스할 수 있다.  트리뷰오는 분류, 클러스터링, 이상 탐지, 회귀 알고리즘 등의 표준 머신러닝 기능들을 제공한다. 데이터 로딩 및 전환용 파이프라인도 포함돼 있으며, 지원되는 예측 작업에 관한 일련의 평가 기능도 제공한다.  트리뷰오는 입력 관련 통계를 수집한다. 이에 따라 각 입력의 범위 등을 설명할 수 있다. 또 기능의 이름을 지정해 내부의 기능 및 출력 ID 관리함으로써 모델 연결(chaining models), 데이터 로딩(loading data) 등의 작업에서 ID 충돌과 혼동을 방지한다. 트리뷰오 모델은 기능을 처음부터 알 수 있다. 다시 말해, 이 모델은 출력 타입을 바꿀 수 없는 강타입(Strongly typed)이므로 무엇이 출력되는지 알 수 있다. 개발자는 플로트(float)가 확률인지, 회귀된 값인지 또는 클러스터 ID인지에 관해 의문을 가질 필요가 없다. 트리뷰오에서는 이들 각각이 별도의 타입이다. 이 모델은 타입과 범위를 설명할 수 있다. 이는 특히 자연어 처리(NLP) 작업에서 유용하다. 강타입의 입력 및 출력을 사용한다는 것은 트리뷰오가 학습...

오라클 트리뷰오 텐서플로우 엑스지부스트 ONNX 자바 오픈소스 머신러닝 머신러닝 라이브러리 아파치 2.0 기트허브 메이븐 센트럴 오라클 랩스 머신러닝 모델 강타입 자연어 처리 파이토치

2020.09.16

‘트리뷰오(Tribuo)’는 텐서플로우(TensorFlow), 엑스지부스트(XGBoost), ONNX(Open Neural Network Exchange)를 위한 인터페이스와 함께 자바로 분류, 클러스터링, 회귀 모델을 구축하고 배포하는 툴을 제공한다.  15일(현지 시각) 오라클이 자바 머신러닝 라이브러리 ‘트리뷰오(Tribuo)’를 오픈소스 라이선스로 무료 제공한다고 발표했다. 머신러닝과 관련한 기업들의 니즈를 충족시키기 위해서다.     오라클의 목표는 트리뷰오를 통해 자바에서 머신러닝 모델을 더욱더 쉽게 구축하고 배포하도록 하는 것이다. 아파치 2.0(Apache 2.0) 라이선스 기반 오픈소스이며, 오라클 랩스(Oracle Labs)가 개발한 트리뷰오는 현재 기트허브(GitHub) 및 메이븐 센트럴(Maven Central)에서 액세스할 수 있다.  트리뷰오는 분류, 클러스터링, 이상 탐지, 회귀 알고리즘 등의 표준 머신러닝 기능들을 제공한다. 데이터 로딩 및 전환용 파이프라인도 포함돼 있으며, 지원되는 예측 작업에 관한 일련의 평가 기능도 제공한다.  트리뷰오는 입력 관련 통계를 수집한다. 이에 따라 각 입력의 범위 등을 설명할 수 있다. 또 기능의 이름을 지정해 내부의 기능 및 출력 ID 관리함으로써 모델 연결(chaining models), 데이터 로딩(loading data) 등의 작업에서 ID 충돌과 혼동을 방지한다. 트리뷰오 모델은 기능을 처음부터 알 수 있다. 다시 말해, 이 모델은 출력 타입을 바꿀 수 없는 강타입(Strongly typed)이므로 무엇이 출력되는지 알 수 있다. 개발자는 플로트(float)가 확률인지, 회귀된 값인지 또는 클러스터 ID인지에 관해 의문을 가질 필요가 없다. 트리뷰오에서는 이들 각각이 별도의 타입이다. 이 모델은 타입과 범위를 설명할 수 있다. 이는 특히 자연어 처리(NLP) 작업에서 유용하다. 강타입의 입력 및 출력을 사용한다는 것은 트리뷰오가 학습...

2020.09.16

김진철의 How-to-Big Data | 빅데이터의 미래 (9)

지난 서른다섯 번째 글부터는 빅데이터 비즈니스와 기술의 미래를 현재 기술들의 동향과 전망을 가지고 같이 엿보고 있다. 빅데이터 비즈니스와 기술의 미래로서, 사이버 물리 시스템(CPS)으로 발전해가는 미래 정보통신 기술과 지능형 서비스의 미래를 소개하였고, 앞으로의 빅데이터 비즈니스와 기술의 발전은 이 사이버 물리 시스템(CPS)으로 구현되는 다양한 지능형 서비스들을 중심으로 이루어질 것이라고 설명하였다. 이와 함께, 이 사이버 물리 시스템(CPS)의 기반이 되는 다양한 기술들의 현재와 미래, 이들의 사이버 물리 시스템과의 관련성에 대해서 살펴보고 있다. 지금까지 클라우드 컴퓨팅 기술, 5G 이동통신과 모바일 에지 컴퓨팅으로 대표되는 미래 통신 기술, 사물인터넷(IoT)과 에지 컴퓨팅 기술들이 어떻게 사이버 물리 시스템(CPS) 기반의 지능형 서비스와 관련이 있는지 같이 살펴보았다.   인공지능 기술에 대한 우리들의 오해 (1) – 지나친 낙관론과 과대평가 이번 글부터 두, 세 편의 글에서는 사이버 물리 시스템(CPS) 기반 지능형 서비스의 가장 핵심이 될 것으로 보이는 인공지능 기술의 현재와 미래, 전망에 대해서 같이 살펴보고자 한다. 우리나라 대기업들이 앞다투어 인공지능 기술에 대한 대규모 투자 계획을 발표하고 있고, 우리나라 정부를 포함한 세계 각국 정부들도 인공지능 기술 경쟁에서 앞서 나가기 위해 다양한 계획들을 발표하고 있는 현 상황에서 과연 이런 인공지능 기술에 대한 열기가 기대하는 만큼의 물질적인 번영과 부를 가져다줄 수 있을지, 그렇다면 어느 정도로 광범위하고 다양하게 우리 사회에 영향을 끼칠지 같이 생각해보는 시간을 가지려고 한다. 2016년 1월 “알파고(AlphaGo)”가 이세돌 9단을 이긴 사건을 계기로 최근 5년간은 IT 기술 매체의 많은 지면과 영역을 인공지능 관련 기술들에 관한 내용이 채워왔다. “알파고”를 만든 구글의 “딥마인드(DeepMind)”는 여전히 수익을 내지 못하고 2019년 8월 기준으로 1조 5천억 원이 ...

김진철 빅데이터 빅데이터 비즈니스 인공지능 사이버 물리 시스템 지능형 서비스 텐서플로우 파이토치 딥러닝 머신러닝 기계학습 알파고 딥마인드 이세돌 우버 튜링테스트 시냅스 신경망 에어플로우 쿠브플로우 폰 노이만 반도체 4차 산업혁명

2020.07.27

지난 서른다섯 번째 글부터는 빅데이터 비즈니스와 기술의 미래를 현재 기술들의 동향과 전망을 가지고 같이 엿보고 있다. 빅데이터 비즈니스와 기술의 미래로서, 사이버 물리 시스템(CPS)으로 발전해가는 미래 정보통신 기술과 지능형 서비스의 미래를 소개하였고, 앞으로의 빅데이터 비즈니스와 기술의 발전은 이 사이버 물리 시스템(CPS)으로 구현되는 다양한 지능형 서비스들을 중심으로 이루어질 것이라고 설명하였다. 이와 함께, 이 사이버 물리 시스템(CPS)의 기반이 되는 다양한 기술들의 현재와 미래, 이들의 사이버 물리 시스템과의 관련성에 대해서 살펴보고 있다. 지금까지 클라우드 컴퓨팅 기술, 5G 이동통신과 모바일 에지 컴퓨팅으로 대표되는 미래 통신 기술, 사물인터넷(IoT)과 에지 컴퓨팅 기술들이 어떻게 사이버 물리 시스템(CPS) 기반의 지능형 서비스와 관련이 있는지 같이 살펴보았다.   인공지능 기술에 대한 우리들의 오해 (1) – 지나친 낙관론과 과대평가 이번 글부터 두, 세 편의 글에서는 사이버 물리 시스템(CPS) 기반 지능형 서비스의 가장 핵심이 될 것으로 보이는 인공지능 기술의 현재와 미래, 전망에 대해서 같이 살펴보고자 한다. 우리나라 대기업들이 앞다투어 인공지능 기술에 대한 대규모 투자 계획을 발표하고 있고, 우리나라 정부를 포함한 세계 각국 정부들도 인공지능 기술 경쟁에서 앞서 나가기 위해 다양한 계획들을 발표하고 있는 현 상황에서 과연 이런 인공지능 기술에 대한 열기가 기대하는 만큼의 물질적인 번영과 부를 가져다줄 수 있을지, 그렇다면 어느 정도로 광범위하고 다양하게 우리 사회에 영향을 끼칠지 같이 생각해보는 시간을 가지려고 한다. 2016년 1월 “알파고(AlphaGo)”가 이세돌 9단을 이긴 사건을 계기로 최근 5년간은 IT 기술 매체의 많은 지면과 영역을 인공지능 관련 기술들에 관한 내용이 채워왔다. “알파고”를 만든 구글의 “딥마인드(DeepMind)”는 여전히 수익을 내지 못하고 2019년 8월 기준으로 1조 5천억 원이 ...

2020.07.27

파이토치, 어떻게 시작할까?··· 알짜배기 학습 정보 5가지 

딥 러닝이 계속해서 '핫'할 것으로 전망되는 가운데 딥 러닝 프레임워크, 즉 텐서플로우와 파이토치를 놓고 저울질하는 이들이 많다. 절대적인 숫자로 보면 구글 텐서플로우가 단연 강세를 보이고 있다. 하지만 페이스북 파이토치의 성장세도 만만치 않다. 쉽고 빠르게 배우고 사용할 수 있다는 점에서 파이토치가 큰 인기를 끌고 있다.  파이토치가 딥 러닝 연구 분야를 강타했다고 해도 과언은 아닐 것이다. 지난 2년간 AI 컨퍼런스에 제출된 논문들을 보면 텐서플로우를 제치고 파이토치로 딥러닝을 구현한 경우가 많았다. 파이토치는 최근 최적화된 모델 생성과 이를 프로덕션 단계로 배포하는 과정에서 엄청난 개선이 이뤄졌다. R&D 연구소를 비롯해 업계에서도 사용할 수 있는 딥 러닝 프레임워크가 된 것이다.  파이토치를 어떻게 공부해야 할까? 이를 배울 수 있는 책과 유료 강좌 등이 아주 많다. 하지만 인터넷에는 이 프레임워크를 무료로 배울 수 있는 리소스들이 아주 많다. 심지어 유료 리소스보다 더 품질이 좋은 무료 리소스도 있다. 파이토치를 배우기에 좋은 무료 온라인 강좌와 튜토리얼을 살펴본다.   파이토치 공식 사이트의 튜토리얼  아마도 ‘공식 웹사이트’에서 파이토치를 시작하는 경우가 많을 것이다. 공식 웹사이트에는 API 레퍼런스부터 이해하기 쉬운 학습 영상(60분 분량), 문서 자료까지 여러 유용한 리소스가 많다. 프레임워크의 기본 및 고급 기능에 관한 안내서도 지원한다.  또한 모델 양자화(quantization)나 프루닝(Pruning)과 같은 중요한 기능이 새롭게 추가되는 경우 이를 사용자의 애플리케이션에 구현하는 방법을 알려주는 퀵 튜토리얼을 제공하기도 한다. 단점도 있다. 다양한 튜토리얼의 코드가 상당히 다르다는 것이다. 때론 파이토치 코드 생성보다 튜토리얼에서 소개하려는 기능들을 보여주고자 표준 단계를 생략해버리는 경우도 있다.  지난 몇 년간 튜토리얼 코드가 개선된 것은 분명하다. 하지만 ...

딥 러닝 파이토치 텐서플로우 구글 페이스북 인공지능 유다시티 에드엑스 패스트에이아이

2020.07.08

딥 러닝이 계속해서 '핫'할 것으로 전망되는 가운데 딥 러닝 프레임워크, 즉 텐서플로우와 파이토치를 놓고 저울질하는 이들이 많다. 절대적인 숫자로 보면 구글 텐서플로우가 단연 강세를 보이고 있다. 하지만 페이스북 파이토치의 성장세도 만만치 않다. 쉽고 빠르게 배우고 사용할 수 있다는 점에서 파이토치가 큰 인기를 끌고 있다.  파이토치가 딥 러닝 연구 분야를 강타했다고 해도 과언은 아닐 것이다. 지난 2년간 AI 컨퍼런스에 제출된 논문들을 보면 텐서플로우를 제치고 파이토치로 딥러닝을 구현한 경우가 많았다. 파이토치는 최근 최적화된 모델 생성과 이를 프로덕션 단계로 배포하는 과정에서 엄청난 개선이 이뤄졌다. R&D 연구소를 비롯해 업계에서도 사용할 수 있는 딥 러닝 프레임워크가 된 것이다.  파이토치를 어떻게 공부해야 할까? 이를 배울 수 있는 책과 유료 강좌 등이 아주 많다. 하지만 인터넷에는 이 프레임워크를 무료로 배울 수 있는 리소스들이 아주 많다. 심지어 유료 리소스보다 더 품질이 좋은 무료 리소스도 있다. 파이토치를 배우기에 좋은 무료 온라인 강좌와 튜토리얼을 살펴본다.   파이토치 공식 사이트의 튜토리얼  아마도 ‘공식 웹사이트’에서 파이토치를 시작하는 경우가 많을 것이다. 공식 웹사이트에는 API 레퍼런스부터 이해하기 쉬운 학습 영상(60분 분량), 문서 자료까지 여러 유용한 리소스가 많다. 프레임워크의 기본 및 고급 기능에 관한 안내서도 지원한다.  또한 모델 양자화(quantization)나 프루닝(Pruning)과 같은 중요한 기능이 새롭게 추가되는 경우 이를 사용자의 애플리케이션에 구현하는 방법을 알려주는 퀵 튜토리얼을 제공하기도 한다. 단점도 있다. 다양한 튜토리얼의 코드가 상당히 다르다는 것이다. 때론 파이토치 코드 생성보다 튜토리얼에서 소개하려는 기능들을 보여주고자 표준 단계를 생략해버리는 경우도 있다.  지난 몇 년간 튜토리얼 코드가 개선된 것은 분명하다. 하지만 ...

2020.07.08

"설치 단순화 및 GPU 연산 지원"··· 마이크로소프트, WSL2 개선사항 발표

마이크로소프트가 윈도우 10 프리뷰 빌드에서 윈도우 서브시스템 포 리눅스 2(WSL2)의 개선 사항을 공개했다. 이번 업데이트로 이제 WSL2는 엔비디아의 쿠다(CUDA) 기술을 이용하는 등의 GPU 연산 기능을 수행할 수 있다. 초보자와 개발자 모두에게 의미 있는 업데이트다.  이 추가 기능은 지난 5월에 열린 빌드 2020(Build 2020) 컨퍼런스에서 마이크로소프트가 약속한 바이기도 하다. 당시 마이크로소프트는 윈도우 서브시스템 포 리눅스(WSL)용 그래픽 UI에 대한 정보를 일부 공개하기도 했다.  이번 WSL 개선사항은 윈도우 10 빌드 20150의 일환으로 등장했다. 현재 이 윈도우 버전은 인사이더 빌드의 데브 채널(Dev Channel)에서 찾아볼 수 있다. 과거 패스트 링(Fast Ring)으로 알려졌던 데브 채널은 윈도우 10 기능 릴리즈와 무관한 신기능을 테스트하는 데 이용되는 공간이다.    설치과정 단순화 이름에서 알 수 있는 것처럼 WSL2를 이용하면 윈도우 내에서 리눅스 커널을 실행할 수 있게 된다. 하드웨어 상에서 네이티브로 실행되는 리눅스 배포판만큼은 아니지만 그에 근접하는 성능을 보여준다.  WSL2가 윈도우에 네이티브로 통합돼 있지도 않다. 이는 사용자가 제어판을 통해 활성화 여부를 선택할 수 있는 옵션 기능이다. 활성화하면 필요한 파일을 다운로드하고 PC를 재부팅하게 된다.  빌드 20150의 신기능 중 하나는 이 과정을 좀더 단순화한 것이다. ‘wsl.exe —install’ 명령을 입력하면 윈도우가 모든 구성을 진행한다. (해당 명령이 명령 줄 앱에서 실행될 수 있는지, 또는 파워셸 인터페이스를 필요로 하는지는 아직 불확실하다.) 윈도우 프로그램 매니저 크레이그 로웬이 게재한 블로그 포스트에 따르면 마이크로소프트는 향후 WSL 내에서 리눅스 배포판이 자동 설치되도록 한다는 구상도 가지고 있다.  리눅스 커널 업데이트도 유사한 방식으로 진행할 수 ...

마이크로소프트 윈도우 리눅스 WSL2 GPU 엔비디아 쿠다 윈도우 10 AI 머신러닝 파이토치 텐서플로우

2020.06.18

마이크로소프트가 윈도우 10 프리뷰 빌드에서 윈도우 서브시스템 포 리눅스 2(WSL2)의 개선 사항을 공개했다. 이번 업데이트로 이제 WSL2는 엔비디아의 쿠다(CUDA) 기술을 이용하는 등의 GPU 연산 기능을 수행할 수 있다. 초보자와 개발자 모두에게 의미 있는 업데이트다.  이 추가 기능은 지난 5월에 열린 빌드 2020(Build 2020) 컨퍼런스에서 마이크로소프트가 약속한 바이기도 하다. 당시 마이크로소프트는 윈도우 서브시스템 포 리눅스(WSL)용 그래픽 UI에 대한 정보를 일부 공개하기도 했다.  이번 WSL 개선사항은 윈도우 10 빌드 20150의 일환으로 등장했다. 현재 이 윈도우 버전은 인사이더 빌드의 데브 채널(Dev Channel)에서 찾아볼 수 있다. 과거 패스트 링(Fast Ring)으로 알려졌던 데브 채널은 윈도우 10 기능 릴리즈와 무관한 신기능을 테스트하는 데 이용되는 공간이다.    설치과정 단순화 이름에서 알 수 있는 것처럼 WSL2를 이용하면 윈도우 내에서 리눅스 커널을 실행할 수 있게 된다. 하드웨어 상에서 네이티브로 실행되는 리눅스 배포판만큼은 아니지만 그에 근접하는 성능을 보여준다.  WSL2가 윈도우에 네이티브로 통합돼 있지도 않다. 이는 사용자가 제어판을 통해 활성화 여부를 선택할 수 있는 옵션 기능이다. 활성화하면 필요한 파일을 다운로드하고 PC를 재부팅하게 된다.  빌드 20150의 신기능 중 하나는 이 과정을 좀더 단순화한 것이다. ‘wsl.exe —install’ 명령을 입력하면 윈도우가 모든 구성을 진행한다. (해당 명령이 명령 줄 앱에서 실행될 수 있는지, 또는 파워셸 인터페이스를 필요로 하는지는 아직 불확실하다.) 윈도우 프로그램 매니저 크레이그 로웬이 게재한 블로그 포스트에 따르면 마이크로소프트는 향후 WSL 내에서 리눅스 배포판이 자동 설치되도록 한다는 구상도 가지고 있다.  리눅스 커널 업데이트도 유사한 방식으로 진행할 수 ...

2020.06.18

AWS, 파이토치용 오픈소스 모델 서버 공개

파이토치 모델을 쉽게 개발하게 해주는 토치서브(TorchServe)는 A/B 테스트를 위한 다중 모델 서빙 및 모델 버전 관리를 지원한다.   아마존웹서비스(AWS)가 파이토치 머신러닝 모델을 제공하기 위한 토치서브라는 오픈소스 툴을 발표했다. 토치서브는 파이토치를 개발한 페이스북과 파트너십을 맺어 AWS에서 유지하고 관리하며 파이토치 프로젝트의 일부가 깃허브에서 제공된다. 4월 21일에 출시된 토치서브는 프로덕션 환경에서 파이토치 모델을 쉽게 배포할 수 있도록 설계되었다. 짧은 대기 시간으로 부담을 주지 않는 환경과 고성능 추론을 제공하는 것이 목표다.  토치서브의 주요 기능은 다음과 같다. • 객체 감지 및 텍스트 분류 같은 범용 애플리케이션을 위한 기본 처리기로 사용자가 모델을 배포하기 위해 사용자 지정 코드를 작성하지 않아도 됨 • 다중 모델 서빙 • A/B 테스트를 위한 모델 버전 관리 • 모니터링 지표 • 애플리케이션 통합을 위한 RESTful 엔드포인트 쿠버네티스, 아마존 세이지메이커(SageMaker), 아마존 EKS, 아마존 EC2를 포함한 모든 배포 환경은 토치서브에서 지원할 수 있다. 토치서브는 우분투 리눅스 또는 맥OS에서 자바11이 필요하다. ciokr@idg.co.kr  

AWS PyTorch 아마존 EKS 아마존 세이지메이커 SageMaker 파이토치 쿠버네티스 아마존웹서비스 리눅스 깃허브 아마존 EC2 기계학습 우분투 자바11

2020.05.08

파이토치 모델을 쉽게 개발하게 해주는 토치서브(TorchServe)는 A/B 테스트를 위한 다중 모델 서빙 및 모델 버전 관리를 지원한다.   아마존웹서비스(AWS)가 파이토치 머신러닝 모델을 제공하기 위한 토치서브라는 오픈소스 툴을 발표했다. 토치서브는 파이토치를 개발한 페이스북과 파트너십을 맺어 AWS에서 유지하고 관리하며 파이토치 프로젝트의 일부가 깃허브에서 제공된다. 4월 21일에 출시된 토치서브는 프로덕션 환경에서 파이토치 모델을 쉽게 배포할 수 있도록 설계되었다. 짧은 대기 시간으로 부담을 주지 않는 환경과 고성능 추론을 제공하는 것이 목표다.  토치서브의 주요 기능은 다음과 같다. • 객체 감지 및 텍스트 분류 같은 범용 애플리케이션을 위한 기본 처리기로 사용자가 모델을 배포하기 위해 사용자 지정 코드를 작성하지 않아도 됨 • 다중 모델 서빙 • A/B 테스트를 위한 모델 버전 관리 • 모니터링 지표 • 애플리케이션 통합을 위한 RESTful 엔드포인트 쿠버네티스, 아마존 세이지메이커(SageMaker), 아마존 EKS, 아마존 EC2를 포함한 모든 배포 환경은 토치서브에서 지원할 수 있다. 토치서브는 우분투 리눅스 또는 맥OS에서 자바11이 필요하다. ciokr@idg.co.kr  

2020.05.08

AWS, 파이토치용 오픈소스 모델 도우미 ‘토치서브’ 발표

AWS가 파이토치(PyTorch) 머신러닝 모델 서비스를 위한 오픈소스 도구인 ‘토치서브’(TorchServe)를 지난 21일 공개했다.  토치서브는 기트허브에서 파이토치 프로젝트의 일부로 제공될 방침이다. AWS가 파이토치를 개발한 페이스북과 파트너십을 맺고 토치서브를 유지 관리하게 된다. AWS는 토치서브가 프로덕션 환경에서 파이토치 모델을 쉽게 배포할 수 있도록 돕기 위해 설계됐다며, 짧은 대기 시간과 고성능 추론을 이용해 가볍게 이용할 수 있도록 하는 것이 목료라고 전했다. 토치 서브의 주요 기능은 다음과 같다. - 개체 감지 및 텍스트 분류와 같은 일반적인 애플리케이션을 위한 기본 핸들러. 이를 통해 사용자는 사용자 지정 코드를 작성하지 않고도 모델을 배포할 수 있다. - 멀티 모델 서빙(serving) - 모니터링을 위한 메트릭스 - 애플리케이션 통합을 위한 RESTful 엔드 포인트 토치서브는 다양한 배포 환경을 지원한다. 쿠버네티스, 아마존 세이지메이커, 아마존 EKS, 아마존 EC2 등에서 이용할 수 있다. 토치서브는 우분투 리눅스 또는 맥OS 상에서 자바 11을 피룡로 한다. 자세한 설치 지침은 기트허브에서 확인할 수 있다. ciokr@idg.co.kr  

AWS 기트허브 파이토치 토치서브

2020.04.27

AWS가 파이토치(PyTorch) 머신러닝 모델 서비스를 위한 오픈소스 도구인 ‘토치서브’(TorchServe)를 지난 21일 공개했다.  토치서브는 기트허브에서 파이토치 프로젝트의 일부로 제공될 방침이다. AWS가 파이토치를 개발한 페이스북과 파트너십을 맺고 토치서브를 유지 관리하게 된다. AWS는 토치서브가 프로덕션 환경에서 파이토치 모델을 쉽게 배포할 수 있도록 돕기 위해 설계됐다며, 짧은 대기 시간과 고성능 추론을 이용해 가볍게 이용할 수 있도록 하는 것이 목료라고 전했다. 토치 서브의 주요 기능은 다음과 같다. - 개체 감지 및 텍스트 분류와 같은 일반적인 애플리케이션을 위한 기본 핸들러. 이를 통해 사용자는 사용자 지정 코드를 작성하지 않고도 모델을 배포할 수 있다. - 멀티 모델 서빙(serving) - 모니터링을 위한 메트릭스 - 애플리케이션 통합을 위한 RESTful 엔드 포인트 토치서브는 다양한 배포 환경을 지원한다. 쿠버네티스, 아마존 세이지메이커, 아마존 EKS, 아마존 EC2 등에서 이용할 수 있다. 토치서브는 우분투 리눅스 또는 맥OS 상에서 자바 11을 피룡로 한다. 자세한 설치 지침은 기트허브에서 확인할 수 있다. ciokr@idg.co.kr  

2020.04.27

파이토치 '뜨고', 파이어폭스 '지고'··· 개발자를 위한 기술 트렌드

개발자 수요는 여전히 높지만 개발자가 성공하기 위해 필요한 기술들은 끊임없이 변화하고 있다. 프로그래밍 역량을 경쟁력 있게 그리고 유행에 맞게 유지하는 방법은 다음과 같다. 기술이 계속 진화하는 것과 마찬가지로 기업이 개발자에게 요구하는 기술 역시 계속해서 달라진다. 오늘날 기업들은 디지털 트랜스포메이션과 데이터 중심 문화로의 전환을 진행 중이다.  이에 따라 인공지능, 머신러닝, 사물인터넷, IT 자동화 등의 기술 분야가 기업의 기술 전략을 주도하고 있다. 또한 급변하는 시장에서 기업의 혁신과 경쟁력 확보에 도움이 될 도커(Docker), 앤서블(Ansible), 애저(Azure)와 같은 도구 활용 기술에 대한 수요도 늘어나고 있다.   코딩 교육 사이트이자 온라인 코딩 툴인 해커랭크(HackerRank)의 CEO 비벡 라비산카는 “기업들이 내부 개발자 조직을 대상으로 ‘기술 지도’를 만들고 있다. 현재 보유 중인 기술과 성장이 필요한 분야를 파악하기 위해서다. 즉 기술 격차를 찾고 이를 메울 수 있는 연수와 교육을 마련하고자 기업들이 이와 같은 역량 평가 프레임워크를 구축하고 있다”라고 말했다.  어떤 분야와 기술이 뜨고 지는지 파악한다면 기업은 물론 개발자도 성공을 위한 적절한 기술 및 지식을 갖추고 있는지 확인할 수 있다. 이를 위해서는 개발자 구인 광고를 뒤지는 것이 가장 효과적이다. 미국의 개발자 구인 사이트 인디드닷컴(Indeed.com)은 최근 관심이 집중되고 있는 기술과 그렇지 않은 기술을 알아보고자 500개의 핵심 IT 기술 용어를 기반으로 구인 광고를 분석했다.  인디드닷컴에 따르면 도커에 대한 언급이 지난 5년간 4,000% 이상 증가했으며 2019년도 미국 전체 기술직 구인 공고 중 5% 이상을 차지했다. IoT 역시 지난 5년간 2,000% 가까이 급상승했다. 이밖에 IT 자동화 및 배포 툴인 앤서블, 실시간 데이터 파이프라인 및 스트리밍 앱 구축용 툴 카프카도 비슷하게 가파른 상승세를 ...

개발자 스프링부트 그래프QL 루커 파이토치 코틀린 구글클라우드플랫폼 닷넷코어 쿠버네티스 테라폼

2020.04.20

개발자 수요는 여전히 높지만 개발자가 성공하기 위해 필요한 기술들은 끊임없이 변화하고 있다. 프로그래밍 역량을 경쟁력 있게 그리고 유행에 맞게 유지하는 방법은 다음과 같다. 기술이 계속 진화하는 것과 마찬가지로 기업이 개발자에게 요구하는 기술 역시 계속해서 달라진다. 오늘날 기업들은 디지털 트랜스포메이션과 데이터 중심 문화로의 전환을 진행 중이다.  이에 따라 인공지능, 머신러닝, 사물인터넷, IT 자동화 등의 기술 분야가 기업의 기술 전략을 주도하고 있다. 또한 급변하는 시장에서 기업의 혁신과 경쟁력 확보에 도움이 될 도커(Docker), 앤서블(Ansible), 애저(Azure)와 같은 도구 활용 기술에 대한 수요도 늘어나고 있다.   코딩 교육 사이트이자 온라인 코딩 툴인 해커랭크(HackerRank)의 CEO 비벡 라비산카는 “기업들이 내부 개발자 조직을 대상으로 ‘기술 지도’를 만들고 있다. 현재 보유 중인 기술과 성장이 필요한 분야를 파악하기 위해서다. 즉 기술 격차를 찾고 이를 메울 수 있는 연수와 교육을 마련하고자 기업들이 이와 같은 역량 평가 프레임워크를 구축하고 있다”라고 말했다.  어떤 분야와 기술이 뜨고 지는지 파악한다면 기업은 물론 개발자도 성공을 위한 적절한 기술 및 지식을 갖추고 있는지 확인할 수 있다. 이를 위해서는 개발자 구인 광고를 뒤지는 것이 가장 효과적이다. 미국의 개발자 구인 사이트 인디드닷컴(Indeed.com)은 최근 관심이 집중되고 있는 기술과 그렇지 않은 기술을 알아보고자 500개의 핵심 IT 기술 용어를 기반으로 구인 광고를 분석했다.  인디드닷컴에 따르면 도커에 대한 언급이 지난 5년간 4,000% 이상 증가했으며 2019년도 미국 전체 기술직 구인 공고 중 5% 이상을 차지했다. IoT 역시 지난 5년간 2,000% 가까이 급상승했다. 이밖에 IT 자동화 및 배포 툴인 앤서블, 실시간 데이터 파이프라인 및 스트리밍 앱 구축용 툴 카프카도 비슷하게 가파른 상승세를 ...

2020.04.20

블로그 | 파이토치로 딥러닝해야 하는 5가지 이유

파이토치가 최근 1.3 및 1.4 릴리스를 통해 풍부한 성능 개선과 모바일 플랫폼용 개발자 친화적인 지원을 제공하면서 강력하게 부상하고 있다. 과연 MX넷, 체이너(Chainer), 텐서플로우(TensorFlow) 등의 다른 프레임워크 대신 파이토치를 선택할 만한 이유가 있을까? 파이토치를 사용해야 할 5가지 이유를 살펴본다.   먼저, 분노의 트윗과 이메일을 보내려 준비하고 있는 텐서플로우 사용자들에게 할 말이 있다. 물론 파이토치가 아닌 텐서플로우를 선택할 이유는 많고, 특히 모바일 또는 웹 플랫폼을 대상으로 작업할 경우에는 텐서플로우가 확실히 유리하다. 이 기사의 주제는 “텐서플로우가 열등하고 파이토치가 뛰어나다”는 것이 아니라, 필자가 파이토치를 가장 먼저 선택하는 이유를 정리하는 것이다. 텐서플로우가 그 나름대로 훌륭하다는 점은 필자도 인정하므로, 너무 분노하지 말기를 바란다.   파이토치는 파이썬이다 사람들이 파이토치를 선택하는 주된 이유 중 하나는 코드를 이해하기가 쉽기 때문이다. 파이토치 프레임워크는 파이썬과 씨름하는 것이 아니라, 함께 작동하도록 설계, 제작되었기 때문이다. 모델과 계층뿐 아니라 다른 모든 것, 옵티마이저, 데이터 로더, 손실 함수, 변환 등도 다름아닌 파이썬 클래스다.   파이토치는 전통적인 텐서플로우의 정적 실행 그래프가 아닌 즉시 실행 모드로 작동하므로(텐서플로우 2.0은 즉시 실행을 제공하지만 매끄럽지 않은 부분이 있음) 맞춤형 파이토치 클래스를 추론하기가 매우 쉽고 텐서보드(TensorBoard) 또는 print() 문에 이르기까지의 표준 파이썬 기법으로 디버깅하고 스택 트레이스 샘플에서 플레임(flame) 그래프를 생성할 수 있다. 덕분에 판다스(Pandas), 사이킷-런(Scikit-learn)과 같은 다른 데이터 과학 프레임워크에서 딥 러닝으로 넘어온 사람들에게도 상당히 친숙하게 느껴진다.   초기 릴리스에서 버전 1.3에 이르기까지 중대한 변경이 하나뿐인(변수에서 텐서로의 변화...

파이썬 파이토치

2020.02.27

파이토치가 최근 1.3 및 1.4 릴리스를 통해 풍부한 성능 개선과 모바일 플랫폼용 개발자 친화적인 지원을 제공하면서 강력하게 부상하고 있다. 과연 MX넷, 체이너(Chainer), 텐서플로우(TensorFlow) 등의 다른 프레임워크 대신 파이토치를 선택할 만한 이유가 있을까? 파이토치를 사용해야 할 5가지 이유를 살펴본다.   먼저, 분노의 트윗과 이메일을 보내려 준비하고 있는 텐서플로우 사용자들에게 할 말이 있다. 물론 파이토치가 아닌 텐서플로우를 선택할 이유는 많고, 특히 모바일 또는 웹 플랫폼을 대상으로 작업할 경우에는 텐서플로우가 확실히 유리하다. 이 기사의 주제는 “텐서플로우가 열등하고 파이토치가 뛰어나다”는 것이 아니라, 필자가 파이토치를 가장 먼저 선택하는 이유를 정리하는 것이다. 텐서플로우가 그 나름대로 훌륭하다는 점은 필자도 인정하므로, 너무 분노하지 말기를 바란다.   파이토치는 파이썬이다 사람들이 파이토치를 선택하는 주된 이유 중 하나는 코드를 이해하기가 쉽기 때문이다. 파이토치 프레임워크는 파이썬과 씨름하는 것이 아니라, 함께 작동하도록 설계, 제작되었기 때문이다. 모델과 계층뿐 아니라 다른 모든 것, 옵티마이저, 데이터 로더, 손실 함수, 변환 등도 다름아닌 파이썬 클래스다.   파이토치는 전통적인 텐서플로우의 정적 실행 그래프가 아닌 즉시 실행 모드로 작동하므로(텐서플로우 2.0은 즉시 실행을 제공하지만 매끄럽지 않은 부분이 있음) 맞춤형 파이토치 클래스를 추론하기가 매우 쉽고 텐서보드(TensorBoard) 또는 print() 문에 이르기까지의 표준 파이썬 기법으로 디버깅하고 스택 트레이스 샘플에서 플레임(flame) 그래프를 생성할 수 있다. 덕분에 판다스(Pandas), 사이킷-런(Scikit-learn)과 같은 다른 데이터 과학 프레임워크에서 딥 러닝으로 넘어온 사람들에게도 상당히 친숙하게 느껴진다.   초기 릴리스에서 버전 1.3에 이르기까지 중대한 변경이 하나뿐인(변수에서 텐서로의 변화...

2020.02.27

‘파이토치 속도 극대화’·· MS, 최적화 라이브러리 공개

마이크로소프트가 오픈소스 프로젝트, 딥스피드(DeepSpeed)를 선보였다. 딥러닝 프레임워크 파이토치(PyTorch) 사용자라면, 최소한의 코드 변경으로 딥스피드를 사용할 수 있다.  마이크로소프트가 2월 10일 자사 리서치 블로그와 기트허브를 통해 딥스피드를 공개했다. 딥스피드는 파이토치의 연산과 개발 속도를 더욱 가속화하는 최적화 라이브러리다. 이는 기존 하드웨어에서 딥러닝 모델을 학습시키는 데 있어 메모리 사용량을 줄이면서도, 더 나은 병렬처리를 이용할 수 있도록 설계됐다.    마이크로소프트 블로그에 따르면 딥스피드는 메모리 최적화 기술을 통해 파이토치 모델의 학습 속도를 향상한다. 또한 해당 모델로 이용할 수 있는 파라미터의 개수를 늘리고, GPU 로컬 메모리를 효과적으로 활용하며, 기존 파이토치 애플리케이션을 재사용하려고 할 때 변경 작업을 최소화한다. 기존 파이토치 코드에 미치는 영향이 최소화됐다는 점이 중요하다. 현재 여러 머신러닝 라이브러리들이 확고하게 자리를 잡고, 많은 애플리케이션이 이 라이브러리들을 기반으로 개발되고 있다. 그 때문에 새로운 프레임워크를 개발하기 보다는 기존 프레임워크를 더 확장하고, 성능을 더 향상시키는 방향이 더욱 활성화되고 있다.  파이토치가 연산과 개발 속도 측면에서 이미 빠르더라도, 더 이상 개선될 여지가 없다는 의미는 아니다. 충분히 향상될 수 있다. 파이토치로 개발한 애플리케이션은 최소한의 코드 변경으로 딥스피드를 사용할 수 있다. 다른 프레임워크로 처음부터 시작할 필요가 없다.  딥스피드가 파이토치의 속도를 더욱 가속화하는 방법은 해당 프레임워크의 기본 병렬처리를 향상시키는 데 있다. 딥스피드 공식 문서는 파이토치의 분산 데이터 병렬 시스템에서 엔비디아 V100 GPU 32GB를 사용해 모델을 학습시키는 경우를 예로 들고 있다. 이때 15억 개의 파라미터를 이용하는 데 GPU에서 메모리 부족이 발생했다. 하지만 딥스피드를 사용하면 동일한 GPU에서&nb...

오픈소스 파라미터 통신오버헤드 예측정확성 병렬처리 딥스피드 딥러닝프레임워크 연산 파이토치 기트허브 딥러닝 메모리 GPU MIT 최적화 애저 마이크로소프트 하이퍼파라미터최적화

2020.02.11

마이크로소프트가 오픈소스 프로젝트, 딥스피드(DeepSpeed)를 선보였다. 딥러닝 프레임워크 파이토치(PyTorch) 사용자라면, 최소한의 코드 변경으로 딥스피드를 사용할 수 있다.  마이크로소프트가 2월 10일 자사 리서치 블로그와 기트허브를 통해 딥스피드를 공개했다. 딥스피드는 파이토치의 연산과 개발 속도를 더욱 가속화하는 최적화 라이브러리다. 이는 기존 하드웨어에서 딥러닝 모델을 학습시키는 데 있어 메모리 사용량을 줄이면서도, 더 나은 병렬처리를 이용할 수 있도록 설계됐다.    마이크로소프트 블로그에 따르면 딥스피드는 메모리 최적화 기술을 통해 파이토치 모델의 학습 속도를 향상한다. 또한 해당 모델로 이용할 수 있는 파라미터의 개수를 늘리고, GPU 로컬 메모리를 효과적으로 활용하며, 기존 파이토치 애플리케이션을 재사용하려고 할 때 변경 작업을 최소화한다. 기존 파이토치 코드에 미치는 영향이 최소화됐다는 점이 중요하다. 현재 여러 머신러닝 라이브러리들이 확고하게 자리를 잡고, 많은 애플리케이션이 이 라이브러리들을 기반으로 개발되고 있다. 그 때문에 새로운 프레임워크를 개발하기 보다는 기존 프레임워크를 더 확장하고, 성능을 더 향상시키는 방향이 더욱 활성화되고 있다.  파이토치가 연산과 개발 속도 측면에서 이미 빠르더라도, 더 이상 개선될 여지가 없다는 의미는 아니다. 충분히 향상될 수 있다. 파이토치로 개발한 애플리케이션은 최소한의 코드 변경으로 딥스피드를 사용할 수 있다. 다른 프레임워크로 처음부터 시작할 필요가 없다.  딥스피드가 파이토치의 속도를 더욱 가속화하는 방법은 해당 프레임워크의 기본 병렬처리를 향상시키는 데 있다. 딥스피드 공식 문서는 파이토치의 분산 데이터 병렬 시스템에서 엔비디아 V100 GPU 32GB를 사용해 모델을 학습시키는 경우를 예로 들고 있다. 이때 15억 개의 파라미터를 이용하는 데 GPU에서 메모리 부족이 발생했다. 하지만 딥스피드를 사용하면 동일한 GPU에서&nb...

2020.02.11

IDG 설문조사

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.6