Offcanvas

��������� ������

쉽게 간편한 데이터 분석에 안성맞춤 '주피터 노트북'이란?

누구나 자신의 작업 내용을 다른 사람에게 보여줘야 할 때가 있다. 대부분 프로그래밍 작업 내용은 가공되지 않은 소스 코드 형태나 컴파일을 거친 실행가능 파일 형태로 공유된다. 소스 코드에는 정보가 빠짐없이 제공되지만 “보여준다”기 보다 “말해 주는” 편에 가깝다. 실행가능 파일은 해당 소프트웨어가 어떤 작업을 하는지 보여 주지만, 소스 코드와 함께 제공되는 경우에도 정확히 어떤 식으로 작동하는지 이해하기 어려운 경향이 있다.    만일 같은 UI에서 코드를 확인하고 실행할 수 있다면 어떨까? 코드를 수정한 후 수정 결과를 즉시 실시간으로 볼 수 있을 것이다. 그것이 바로 주피터 노트북(Jupyter Notebook)에서 제공되는 기능이다.   주피터 노트북은 손쉽게 누군가의 프로그래밍 작업 내용을 보여주고 다른 사람들이 참여할 수 있도록 만들어졌다. ‘노트북’이라는 대화형 문서에 코드와 의견, 멀티미디어, 시각화 자료 등을 결합해 이를 공유하고 재사용 및 재작업할 수 있게 해 준다.   웹 브라우저를 통해 실행되므로 주피터 노트북 자체를 자신의 로컬 시스템이나 원격 서버에 호스팅할 수 있다.     주피터 노트북의 텍스트, 코드, 시각화 화면. 코드를 변경하고 브라우저에서 다시 실행하면 결과물도 바꾸고 새 결과를 새 노트에 저장할 수 있다. 주피터 노트북의 장점 주피터 노트북은 원래 파이썬, R, 줄리아 등의 언어로 작성된 데이터 과학 애플리케이션용으로 개발되었기 때문에 다음과 같은 각종 프로젝트에 다양한 방식으로 유용하다. • 데이터 시각화. 대부분 사람이 주피터 노트북을 처음 접하는 것은 데이터 시각화를 통해서다. 데이터 시각화란 일부 데이터 모음의 렌더링이 그래픽으로 포함된 공유 노트북을 말한다. 주피터 노트북을 통해 시각화를 작성하고 공유할 수 있으며 공유된 코드 및 데이터 모음에 대화형 수정도 가능하다. &bul...

빅데이터 줄리아 주피터 노트북 R 데이터 과학 파이썬 분석 시각화 브라우저 Jupyter Notebook

2019.03.08

누구나 자신의 작업 내용을 다른 사람에게 보여줘야 할 때가 있다. 대부분 프로그래밍 작업 내용은 가공되지 않은 소스 코드 형태나 컴파일을 거친 실행가능 파일 형태로 공유된다. 소스 코드에는 정보가 빠짐없이 제공되지만 “보여준다”기 보다 “말해 주는” 편에 가깝다. 실행가능 파일은 해당 소프트웨어가 어떤 작업을 하는지 보여 주지만, 소스 코드와 함께 제공되는 경우에도 정확히 어떤 식으로 작동하는지 이해하기 어려운 경향이 있다.    만일 같은 UI에서 코드를 확인하고 실행할 수 있다면 어떨까? 코드를 수정한 후 수정 결과를 즉시 실시간으로 볼 수 있을 것이다. 그것이 바로 주피터 노트북(Jupyter Notebook)에서 제공되는 기능이다.   주피터 노트북은 손쉽게 누군가의 프로그래밍 작업 내용을 보여주고 다른 사람들이 참여할 수 있도록 만들어졌다. ‘노트북’이라는 대화형 문서에 코드와 의견, 멀티미디어, 시각화 자료 등을 결합해 이를 공유하고 재사용 및 재작업할 수 있게 해 준다.   웹 브라우저를 통해 실행되므로 주피터 노트북 자체를 자신의 로컬 시스템이나 원격 서버에 호스팅할 수 있다.     주피터 노트북의 텍스트, 코드, 시각화 화면. 코드를 변경하고 브라우저에서 다시 실행하면 결과물도 바꾸고 새 결과를 새 노트에 저장할 수 있다. 주피터 노트북의 장점 주피터 노트북은 원래 파이썬, R, 줄리아 등의 언어로 작성된 데이터 과학 애플리케이션용으로 개발되었기 때문에 다음과 같은 각종 프로젝트에 다양한 방식으로 유용하다. • 데이터 시각화. 대부분 사람이 주피터 노트북을 처음 접하는 것은 데이터 시각화를 통해서다. 데이터 시각화란 일부 데이터 모음의 렌더링이 그래픽으로 포함된 공유 노트북을 말한다. 주피터 노트북을 통해 시각화를 작성하고 공유할 수 있으며 공유된 코드 및 데이터 모음에 대화형 수정도 가능하다. &bul...

2019.03.08

김진철의 How-to-Big Data | 빅데이터 조직과 시스템 (5)

데이터 과학자는 사람이 아니라 한 팀인가? – 데이터 과학자 역량 범위의 논란 2016년쯤에 필자가 빅데이터에 관해 읽었던 한 매체의 글에서 데이터 과학자는 한 사람이 아니라 팀을 의미한다는 요지의 주장을 펴는 글을 읽은 적이 있다. 그 글에서 그렇게 주장하는 근거는, 데이터 과학자가 갖추어야 한다고 알려졌던 역량들이 현실적으로 IT시장에서 한 사람이 갖출 수 있는 기술과 역량으로 보기에는 지나치게 스펙트럼이 넓고 많다는 것이었다.  필자가 그 글을 읽으면서, 새롭게 각광받는 IT업계의 직업군으로 떠오르고 있던 데이터 과학자에 대해, 데이터 과학에 대한 경험이 없는 IT전문가와 많은 전문 영역과 기술로 분화되어 전문성이 파편화되어 있는 IT업계에서 데이터 과학자를 보았을 때, 저렇게 다양한 분야의 기술과 역량을 갖추고 일하는 사람이 과연 있을 수 있는가라는 생각을 했을 수도 있겠다는 생각이 들었다. IT업계는 소프트웨어든 하드웨어든 새로운 기술이 부각되면 이 기술에 대한 전문성으로 컨설팅과 서비스, 제품을 제공하면서 업계에서 자리 잡는 것이 일반화되었기에 다양한 영역의 기술과 역량을 가지고 문제 해결에 집중하는 데이터 과학자의 역할과 역량에 대해서 다소 생소한 느낌이 들었을 수도 있겠다는 생각이 든다.   지금까지 IT전문가들은 하나의 기술, 하나의 제품을 깊이 있게 이해하고 이러한 깊이 있는 이해를 바탕으로 해당 기술을 구현한 제품이나 서비스가 고객의 비즈니스 문제 해결이나 운영을 어떻게 돕거나 개선할 수 있는지 컨설팅을 제공하고, 이러한 컨설팅 결과에 따라 제품이나 기술, 솔루션을 고객 비즈니스에 제공, 통합하는 것이 주된 일이었다. 이 때문에 하나의 기술이나 제품에 대한 전문성만으로도 IT전문가로서 활동할 수 있었다. 이런 관점에서 보면 데이터 과학자들이 갖추어야 할 것으로 기대되는 다양한 분야의 역량들을 과연 한 사람이 갖추는 것이 가능하냐라는 생각이 들 수도 있다. 데이터 과학자가 갖추어야 하는 역량의 영역이 넓...

CIO 데이터 분석가 데이터 엔지니어 김진철 데이터 과학 분석 CTO 비즈니스 인텔리전스 데이터 과학자 빅데이터 데이터 마이너

2019.02.26

데이터 과학자는 사람이 아니라 한 팀인가? – 데이터 과학자 역량 범위의 논란 2016년쯤에 필자가 빅데이터에 관해 읽었던 한 매체의 글에서 데이터 과학자는 한 사람이 아니라 팀을 의미한다는 요지의 주장을 펴는 글을 읽은 적이 있다. 그 글에서 그렇게 주장하는 근거는, 데이터 과학자가 갖추어야 한다고 알려졌던 역량들이 현실적으로 IT시장에서 한 사람이 갖출 수 있는 기술과 역량으로 보기에는 지나치게 스펙트럼이 넓고 많다는 것이었다.  필자가 그 글을 읽으면서, 새롭게 각광받는 IT업계의 직업군으로 떠오르고 있던 데이터 과학자에 대해, 데이터 과학에 대한 경험이 없는 IT전문가와 많은 전문 영역과 기술로 분화되어 전문성이 파편화되어 있는 IT업계에서 데이터 과학자를 보았을 때, 저렇게 다양한 분야의 기술과 역량을 갖추고 일하는 사람이 과연 있을 수 있는가라는 생각을 했을 수도 있겠다는 생각이 들었다. IT업계는 소프트웨어든 하드웨어든 새로운 기술이 부각되면 이 기술에 대한 전문성으로 컨설팅과 서비스, 제품을 제공하면서 업계에서 자리 잡는 것이 일반화되었기에 다양한 영역의 기술과 역량을 가지고 문제 해결에 집중하는 데이터 과학자의 역할과 역량에 대해서 다소 생소한 느낌이 들었을 수도 있겠다는 생각이 든다.   지금까지 IT전문가들은 하나의 기술, 하나의 제품을 깊이 있게 이해하고 이러한 깊이 있는 이해를 바탕으로 해당 기술을 구현한 제품이나 서비스가 고객의 비즈니스 문제 해결이나 운영을 어떻게 돕거나 개선할 수 있는지 컨설팅을 제공하고, 이러한 컨설팅 결과에 따라 제품이나 기술, 솔루션을 고객 비즈니스에 제공, 통합하는 것이 주된 일이었다. 이 때문에 하나의 기술이나 제품에 대한 전문성만으로도 IT전문가로서 활동할 수 있었다. 이런 관점에서 보면 데이터 과학자들이 갖추어야 할 것으로 기대되는 다양한 분야의 역량들을 과연 한 사람이 갖추는 것이 가능하냐라는 생각이 들 수도 있다. 데이터 과학자가 갖추어야 하는 역량의 영역이 넓...

2019.02.26

데이터 분석용 주요 개발 언어 1위 파이썬 <젯브레인 조사>

파이썬용 파이참(PyCharm) IDE의 제조사인 젯브레인(JetBrains)이 2018년 파이썬 개발자 설문조사 결과를 공개했다. 이는 전세계 2만 명이 넘는 기업 소속 파이썬 개발자 및 독립적으로 활동하는 파이썬 개발자가 툴, 환경 설정, 정서 등을 파악하기 위한 조사다. 이 설문조사는 데이터 분석이 주요 사례로 부상하면서 파이썬 사용이 전반적으로 증가하며 웹 개발, 테스트, 자동화가 계속 강력해지고 있음을 보여줬다. 설문조사에 참여한 파이썬 개발자 중 84%는 주요 개발 언어로 파이썬을 꼽았으며, 나머지 16%는 파이썬을 부차적인 개발 언어로 사용한다고 답했다. 개발자 50%는 파이썬과 함께 사용하는 개발 언어로 자바스크립트를 지목했고, 47%는 HTML/CSS를 꼽았다. 이들은 웹 프론트엔드(예 : 일렉트론(Electron))가 탑재된 공개 웹 사이트, 비공개 앱 또는 데스크톱 애플리케이션인 파이썬의 웹 애플리케이션 구축에서 주요 개발 언어로 사용하는 것으로 파악됐다.  파이썬 2와 파이썬 3를 사용하는 비중을 보면 84%가 파이썬 3를, 16%가 파이썬 2를 사용 중으로 나타났다. 파이썬 3 사용자 중 54%는 파이썬 3.6을, 30%는 파이썬 3.7을, 나머지는 다른 버전을 각각 사용 중으로 파악됐다.  2013년부터 파이썬 3가 꾸준히 성장했고, 사용자의 일부는 2020년 말까지 파이썬 3를 계속 작업에 활용할 것으로 예상된다. 파이썬 2를 고수하는 개발자는 기존 코드의 중요성, 기관 요구 사항, 단순한 선호도 등과 크게 관련이 없는 것으로 나타났다. 설문조사에서 파이썬을 주로 어디에 활용하는지 모두 선택하라고 했을 때 개발자의 52%는 파이썬을 주로 웹 개발에 사용한다고 답했다. 하지만 단 한가지만을 꼽도록 했더니 웹 개발이 27%로 낮아졌다. 또한 설문조사에 따르면 가장 널리 사용되는 파이썬 웹 프레임워크는 플라스크(47%)와 장고(45%)로 파악됐다.  개발자들이 웹 개발보다 더 많이 파이썬을 사용하는 ...

빅데이터 웹 개발 데이터 과학 리눅스 파이썬 분석 언어 비주얼 스튜디오 윈도우 마이크로소프트 설문조사 젯브레인

2019.02.07

파이썬용 파이참(PyCharm) IDE의 제조사인 젯브레인(JetBrains)이 2018년 파이썬 개발자 설문조사 결과를 공개했다. 이는 전세계 2만 명이 넘는 기업 소속 파이썬 개발자 및 독립적으로 활동하는 파이썬 개발자가 툴, 환경 설정, 정서 등을 파악하기 위한 조사다. 이 설문조사는 데이터 분석이 주요 사례로 부상하면서 파이썬 사용이 전반적으로 증가하며 웹 개발, 테스트, 자동화가 계속 강력해지고 있음을 보여줬다. 설문조사에 참여한 파이썬 개발자 중 84%는 주요 개발 언어로 파이썬을 꼽았으며, 나머지 16%는 파이썬을 부차적인 개발 언어로 사용한다고 답했다. 개발자 50%는 파이썬과 함께 사용하는 개발 언어로 자바스크립트를 지목했고, 47%는 HTML/CSS를 꼽았다. 이들은 웹 프론트엔드(예 : 일렉트론(Electron))가 탑재된 공개 웹 사이트, 비공개 앱 또는 데스크톱 애플리케이션인 파이썬의 웹 애플리케이션 구축에서 주요 개발 언어로 사용하는 것으로 파악됐다.  파이썬 2와 파이썬 3를 사용하는 비중을 보면 84%가 파이썬 3를, 16%가 파이썬 2를 사용 중으로 나타났다. 파이썬 3 사용자 중 54%는 파이썬 3.6을, 30%는 파이썬 3.7을, 나머지는 다른 버전을 각각 사용 중으로 파악됐다.  2013년부터 파이썬 3가 꾸준히 성장했고, 사용자의 일부는 2020년 말까지 파이썬 3를 계속 작업에 활용할 것으로 예상된다. 파이썬 2를 고수하는 개발자는 기존 코드의 중요성, 기관 요구 사항, 단순한 선호도 등과 크게 관련이 없는 것으로 나타났다. 설문조사에서 파이썬을 주로 어디에 활용하는지 모두 선택하라고 했을 때 개발자의 52%는 파이썬을 주로 웹 개발에 사용한다고 답했다. 하지만 단 한가지만을 꼽도록 했더니 웹 개발이 27%로 낮아졌다. 또한 설문조사에 따르면 가장 널리 사용되는 파이썬 웹 프레임워크는 플라스크(47%)와 장고(45%)로 파악됐다.  개발자들이 웹 개발보다 더 많이 파이썬을 사용하는 ...

2019.02.07

존슨앤드존슨 CIO에게 듣는 '애자일 디지털 트랜스포메이션'

스튜어트 맥기건에게 트랜스포메이션은 낯설지 않다. 오랜 기간의 IT리더이자 2018년 CIO 명예의 전당에 선정된 그는 리버티 뮤추얼(Liberty Mutual), CVS, 존슨앤드존슨(Johnson & Johnson)에서 임원을 역임하며 빛나는 변화를 이끌었기 때문이다.  2012년 의료 분야 거대 기업인 존슨앤드존슨에 합류한 이래 맥기건은 애자일 개발 프로세스를 이용해 J&J의 IT를 변혁시켰다. 아울러 회사의 구형 온-프레미스 시스템의 많은 부분을 하이브리드 클라우드로 이전하며 IT 비용과 복잡성을 줄이기도 했다.  CIO닷컴은 최근 맥기건(사진)과 이 여정에 관해 이야기를 나누었다. 예를 들어 디자인 씽킹과 데이터 과학의 중요성, 그리고 애자일에서 변화 관리 프로그램이 부실한 전략, 계획, 소통의 명확한 징후인 이유 등이다. 그와의 대담을 Q&A로 정리했다.  CIO닷컴 : 당신은 자신의 애자일 트랜스포메이션을 ‘고-카트에 로켓을 장착한 것’에 비유했다. 왜 로켓 추진 고-카트가 필요했나?  스튜어트 맥기건(이하 맥기건) : 기술 전략 같은 것은 없다. 기술 컴포넌트를 가진 비즈니스 전략만 있을 뿐이다. 애자일은 비즈니스 전략과 비즈니스 목적의 맥락 안에 들어 있어야 한다.  가장 중요한 것은 자신이 무엇을, 왜 하려는지 아는 것이다. 우리의 경우, 이는 고객 요구를 충족하고, 환자 요구를 충족하며, 보건 의료기관의 요구를 충족하는 것이다. 스티어링 메커니즘(steering mechanism)이 되면 애자일은 점점 더 빠르게 가치를 충족할 수 있다. 애자일을 기술 전략이라고 생각한다면 기능을 매우 신속히 전달하는 메커니즘을 배치하는 것이겠지만 정확한 문제를 겨냥하고 있는지는 알 길이 없다. 고-카트에 로켓을 부착한다는 발상이 바로 애자일이다. 빨리 가는 것만이 능사가 아니다. 올바른 방향으로 빨리 가야 한다.  우리에게는 로켓 추진 고-카트가 없었다...

애자일 J&J 디자인 씽킹 디지털 변혁 데이터 과학 변화 관리 애널리틱스 분석 하이브리드 클라우드 컴플라이언스 표준화 CIO 존슨앤드존슨

2019.01.07

스튜어트 맥기건에게 트랜스포메이션은 낯설지 않다. 오랜 기간의 IT리더이자 2018년 CIO 명예의 전당에 선정된 그는 리버티 뮤추얼(Liberty Mutual), CVS, 존슨앤드존슨(Johnson & Johnson)에서 임원을 역임하며 빛나는 변화를 이끌었기 때문이다.  2012년 의료 분야 거대 기업인 존슨앤드존슨에 합류한 이래 맥기건은 애자일 개발 프로세스를 이용해 J&J의 IT를 변혁시켰다. 아울러 회사의 구형 온-프레미스 시스템의 많은 부분을 하이브리드 클라우드로 이전하며 IT 비용과 복잡성을 줄이기도 했다.  CIO닷컴은 최근 맥기건(사진)과 이 여정에 관해 이야기를 나누었다. 예를 들어 디자인 씽킹과 데이터 과학의 중요성, 그리고 애자일에서 변화 관리 프로그램이 부실한 전략, 계획, 소통의 명확한 징후인 이유 등이다. 그와의 대담을 Q&A로 정리했다.  CIO닷컴 : 당신은 자신의 애자일 트랜스포메이션을 ‘고-카트에 로켓을 장착한 것’에 비유했다. 왜 로켓 추진 고-카트가 필요했나?  스튜어트 맥기건(이하 맥기건) : 기술 전략 같은 것은 없다. 기술 컴포넌트를 가진 비즈니스 전략만 있을 뿐이다. 애자일은 비즈니스 전략과 비즈니스 목적의 맥락 안에 들어 있어야 한다.  가장 중요한 것은 자신이 무엇을, 왜 하려는지 아는 것이다. 우리의 경우, 이는 고객 요구를 충족하고, 환자 요구를 충족하며, 보건 의료기관의 요구를 충족하는 것이다. 스티어링 메커니즘(steering mechanism)이 되면 애자일은 점점 더 빠르게 가치를 충족할 수 있다. 애자일을 기술 전략이라고 생각한다면 기능을 매우 신속히 전달하는 메커니즘을 배치하는 것이겠지만 정확한 문제를 겨냥하고 있는지는 알 길이 없다. 고-카트에 로켓을 부착한다는 발상이 바로 애자일이다. 빨리 가는 것만이 능사가 아니다. 올바른 방향으로 빨리 가야 한다.  우리에게는 로켓 추진 고-카트가 없었다...

2019.01.07

'데브옵스부터 데이터 과학까지' 2019년 고액 연봉 기대되는 IT직종은?

새해에 급여 인상을 원하나? 경력을 쌓으며 성장하는 데 돈만을 근거로 삼아서는 안 되지만, 돈은 분명 중요하다. 페이스케일(PayScale) 연봉 통계로 본 2019년 고액 연봉이 기대되는 IT직종을 소개한다.    1. 데이터 과학 이 분야의 종사자들은 다양한 소스의 복잡한 데이터를 해석하기 위해 통계와 모델링에 관한 지식을 사용한다. 이 분야에서 성공하려면 세 가지 주요 기술 즉 통계적 추론, 커뮤니케이션, 프로그래밍이 필요하다. 가장 높은 연봉을 받는 직업은 다음과 같다. 데이터 과학자 : 45,000파운드(6,414만 원) 데이터 아키텍트 : 57,535파운드(8,200만 원) 데이터 엔지니어 : 41,323파운드(5,891만 원) 데이터베이스 관리자 : 43,169파운드(6,154만 원) 2. IT관리자 IT관리자는 팀과 긴밀하게 일하며 마감 일정을 맞추고 새로운 시스템과 개발을 감독하면서 비즈니스 기술 의사결정을 주도한다. 가장 높은 연봉을 받는 직업은 다음과 같다. 선임 IT 감사 관리자 : 49,290파운드(7,027만 원) IT 거버넌스 관리자 : 50,625파운드(7,218만 원) IT 프로그램 관리자 : 82,500파운드(1억 1,762만 원) IT 리스크 관리자 : 72,500파운드(1억 336만 원) 3. 소프트웨어 개발 연간 53,482파운드(7,625만 원)를 벌고 싶나? 소프트웨어 개발자는 패션에서 금융까지 다양한 산업 분야에서 일할 수 있다. 이들의 주요 역할은 소프트웨어 및 웹 애플리케이션을 설계하는 것이지만 때로는 직원 교육, 새로운 고용 창출, 예산 총괄에 대한 임무도 맡는다. 가장 높은 연봉을 받는 직업은 다음과 같다. 소프트웨어 개발 관리자 : 53,482파운드(7,625만 원) 소프트웨어 엔지니어 : 41,724파운드(5,946만 원) 소프트웨어 엔지니어링 관리자 : 61,332 파운드(8,740만 원) 4. 소프트웨어 아키텍처 소프트웨어 아키텍처는 소프트웨어 엔지니어링과 다르다. ...

PM IT관리 페이스케일 데브옵스 데이터 과학 파이썬 급여 연봉 프로젝트 관리 소프트웨어 AWS DBMS 거버넌스 아마존웹서비스

2018.12.24

새해에 급여 인상을 원하나? 경력을 쌓으며 성장하는 데 돈만을 근거로 삼아서는 안 되지만, 돈은 분명 중요하다. 페이스케일(PayScale) 연봉 통계로 본 2019년 고액 연봉이 기대되는 IT직종을 소개한다.    1. 데이터 과학 이 분야의 종사자들은 다양한 소스의 복잡한 데이터를 해석하기 위해 통계와 모델링에 관한 지식을 사용한다. 이 분야에서 성공하려면 세 가지 주요 기술 즉 통계적 추론, 커뮤니케이션, 프로그래밍이 필요하다. 가장 높은 연봉을 받는 직업은 다음과 같다. 데이터 과학자 : 45,000파운드(6,414만 원) 데이터 아키텍트 : 57,535파운드(8,200만 원) 데이터 엔지니어 : 41,323파운드(5,891만 원) 데이터베이스 관리자 : 43,169파운드(6,154만 원) 2. IT관리자 IT관리자는 팀과 긴밀하게 일하며 마감 일정을 맞추고 새로운 시스템과 개발을 감독하면서 비즈니스 기술 의사결정을 주도한다. 가장 높은 연봉을 받는 직업은 다음과 같다. 선임 IT 감사 관리자 : 49,290파운드(7,027만 원) IT 거버넌스 관리자 : 50,625파운드(7,218만 원) IT 프로그램 관리자 : 82,500파운드(1억 1,762만 원) IT 리스크 관리자 : 72,500파운드(1억 336만 원) 3. 소프트웨어 개발 연간 53,482파운드(7,625만 원)를 벌고 싶나? 소프트웨어 개발자는 패션에서 금융까지 다양한 산업 분야에서 일할 수 있다. 이들의 주요 역할은 소프트웨어 및 웹 애플리케이션을 설계하는 것이지만 때로는 직원 교육, 새로운 고용 창출, 예산 총괄에 대한 임무도 맡는다. 가장 높은 연봉을 받는 직업은 다음과 같다. 소프트웨어 개발 관리자 : 53,482파운드(7,625만 원) 소프트웨어 엔지니어 : 41,724파운드(5,946만 원) 소프트웨어 엔지니어링 관리자 : 61,332 파운드(8,740만 원) 4. 소프트웨어 아키텍처 소프트웨어 아키텍처는 소프트웨어 엔지니어링과 다르다. ...

2018.12.24

클라우데라-호튼웍스 합병이 빅데이터 업계에 의미하는 바는?

클라우데라-호튼웍스 합병은 엔터프라이즈급 오픈소스 데이터 솔루션으로 계속해서 수익을 수익 창출하고자 분투하는 빅데이터 업계를 놀라게 했다. 또한 이번 합병을 두고 ‘피할 수 없는 선택’이라는 시각도 일부 있다. 클라우데라와 호튼웍스은 한때 벤처캐피탈 투자에서 주목받던 ‘유니콘’이었다. 이 두 업체는 오픈소스 지원 솔루션으로 수익을 낸다는 공통점이 있다. ->클라우데라-호튼웍스, 전격 합병··· '52억 달러' 거대 데이터 기업 탄생 이번 합병에 관해 호튼웍스 CEO 롭 베어든은 "두 회사 주주들의 가치 창출을 물론이고 고객, 파트너, 직원, 오픈소스 공동체가 이 제품에 내재된 강화된 제품, 더 큰 규모 및 향상된 비용 경쟁력의 혜택을 누리게 될 것이다"라고 밝혔다. 새로운 합병 회사에서 클라우데라는 주식의 약 60%를 보유하게 되며 클라우데라의 CEO인 톰 레일리는 새로운 합병 회사의 CEO를 맡을 예정이다. 규제 및 주주 승인을 조건으로 이 합병은 2019년 1분기에 마무리될 것으로 예상된다. 재무 현황 두 회사의 재무 상태는 상당히 비슷하다. 클라우데라는 2017년에 2억 6,100만 달러의 매출을 올렸고, 2억 8,000만 달러의 영업 손실을 기록했다. 호튼웍스는 2017년에 2억 6,200만 달러의 매출을 올렸고, 1억 9,000만 달러의 영업 손실을 기록했다. 클라우데라의 IPO 과정은 인텔의 엄청난 투자 때문에 순탄하지 못했다. 인텔이 클라우데라의 20% 이상을 소유할 수 없다는 조항 때문이었다. 시킹 알파(Seeking Alpha)에 따르면 올해 초 클라우데라는 "충분한 매출을 올리지 못하는 고객에 초점을 맞춤으로써 영업 전략을 잘못 이해했다"며 "목표 시장을 벗어난 새로운 고객을 유치하는 데 주력했기 때문에 기존 고객의 확대가 부족했다"고 밝힌...

M&A 멀티 클라우드 데이터 과학 사물인터넷 호튼웍스 클라우데라 하둡 데이터웨어하우스 합병 매출 DW 빅데이터 재무 영업 손실

2018.10.10

클라우데라-호튼웍스 합병은 엔터프라이즈급 오픈소스 데이터 솔루션으로 계속해서 수익을 수익 창출하고자 분투하는 빅데이터 업계를 놀라게 했다. 또한 이번 합병을 두고 ‘피할 수 없는 선택’이라는 시각도 일부 있다. 클라우데라와 호튼웍스은 한때 벤처캐피탈 투자에서 주목받던 ‘유니콘’이었다. 이 두 업체는 오픈소스 지원 솔루션으로 수익을 낸다는 공통점이 있다. ->클라우데라-호튼웍스, 전격 합병··· '52억 달러' 거대 데이터 기업 탄생 이번 합병에 관해 호튼웍스 CEO 롭 베어든은 "두 회사 주주들의 가치 창출을 물론이고 고객, 파트너, 직원, 오픈소스 공동체가 이 제품에 내재된 강화된 제품, 더 큰 규모 및 향상된 비용 경쟁력의 혜택을 누리게 될 것이다"라고 밝혔다. 새로운 합병 회사에서 클라우데라는 주식의 약 60%를 보유하게 되며 클라우데라의 CEO인 톰 레일리는 새로운 합병 회사의 CEO를 맡을 예정이다. 규제 및 주주 승인을 조건으로 이 합병은 2019년 1분기에 마무리될 것으로 예상된다. 재무 현황 두 회사의 재무 상태는 상당히 비슷하다. 클라우데라는 2017년에 2억 6,100만 달러의 매출을 올렸고, 2억 8,000만 달러의 영업 손실을 기록했다. 호튼웍스는 2017년에 2억 6,200만 달러의 매출을 올렸고, 1억 9,000만 달러의 영업 손실을 기록했다. 클라우데라의 IPO 과정은 인텔의 엄청난 투자 때문에 순탄하지 못했다. 인텔이 클라우데라의 20% 이상을 소유할 수 없다는 조항 때문이었다. 시킹 알파(Seeking Alpha)에 따르면 올해 초 클라우데라는 "충분한 매출을 올리지 못하는 고객에 초점을 맞춤으로써 영업 전략을 잘못 이해했다"며 "목표 시장을 벗어난 새로운 고객을 유치하는 데 주력했기 때문에 기존 고객의 확대가 부족했다"고 밝힌...

2018.10.10

싱가포르, 1만 2천 명에 무료 인공지능 교육 제공

만인을 위한 AI(AI4E)와 산업AI(AI4I)라는 두 가지 프로그램을 통해 AI 싱가포르가 1만 2,000명을 교육하고 전문가가 AI를 기술적으로 준비하도록 돕고자 한다. 8월 30일 AI 싱가포르(AISG)는 테크스킬액셀러레이터(TechSkills Accelerator, TeSA) 전략을 통해 1만 2,000명 이상의 사람들이 인공지능 노하우를 습득할 수 있도록 하는 인포컴 미디어 개발위원회(Infocomm Media Development Authority, IMDA)와 협력하여 두 가지 새로운 계획을 발표했다. AI 싱가포르 첫 기념행사에서 통상부장관인 이스와란은 AI4E와 AI4I라는 두 프로그램을 공식적으로 언급했다. 두 가지 전략은 AI에 관해 싱가포르 사람들에게 일상생활에서 기술이 어떻게 도움이 되는지 보여줌으로써 산업 전문가들이 준비하도록 하고 경쟁력을 갖추며 AI를 통해 생산적으로 작업하도록 하는 것을 목표로 한다. 이스와란은 "AI4E 프로그램이 교육 참가자들에게 AI를 익숙하게 하고 그들이 일상생활에서 어떻게 사용될 수 있는지 이해하도록 돕다"며 "싱가포르는 인공지능 생태계를 더욱 발전시킬 수 있는 인재가 필요하다"고 강조했다. "AI 싱가포르는 연구기관 및 산업계와 긴밀히 협력하여 싱가포르에서 AI 인재의 강력한 파이프라인을 육성함으로써 핵심적인 역할을 수행할 수 있다"고 이스완란은 기대했다.   AISG는 IMDA, PA(People's Association), NTUC U-어소시에이츠(National Trades Union Congress U-Associates)와 같은 지역사회단체 및 파트너와 함께 AI4E 프로그램을 통해 1만 명의 사람들을 참여시킬 수 있다. AISG는 학교, 폴리테크닉대학, ITE(Institutes of Technical Education)와 협력하여 전제 조건에서 유사한 워크숍을 진행하고 있다. 이 ...

CIO 만인을 위한 AI AI4I 산업AI 데이터캠프 데이터 과학 파이썬 싱가포르 인공지능 마이크로소프트 인텔 AI4E

2018.08.31

만인을 위한 AI(AI4E)와 산업AI(AI4I)라는 두 가지 프로그램을 통해 AI 싱가포르가 1만 2,000명을 교육하고 전문가가 AI를 기술적으로 준비하도록 돕고자 한다. 8월 30일 AI 싱가포르(AISG)는 테크스킬액셀러레이터(TechSkills Accelerator, TeSA) 전략을 통해 1만 2,000명 이상의 사람들이 인공지능 노하우를 습득할 수 있도록 하는 인포컴 미디어 개발위원회(Infocomm Media Development Authority, IMDA)와 협력하여 두 가지 새로운 계획을 발표했다. AI 싱가포르 첫 기념행사에서 통상부장관인 이스와란은 AI4E와 AI4I라는 두 프로그램을 공식적으로 언급했다. 두 가지 전략은 AI에 관해 싱가포르 사람들에게 일상생활에서 기술이 어떻게 도움이 되는지 보여줌으로써 산업 전문가들이 준비하도록 하고 경쟁력을 갖추며 AI를 통해 생산적으로 작업하도록 하는 것을 목표로 한다. 이스와란은 "AI4E 프로그램이 교육 참가자들에게 AI를 익숙하게 하고 그들이 일상생활에서 어떻게 사용될 수 있는지 이해하도록 돕다"며 "싱가포르는 인공지능 생태계를 더욱 발전시킬 수 있는 인재가 필요하다"고 강조했다. "AI 싱가포르는 연구기관 및 산업계와 긴밀히 협력하여 싱가포르에서 AI 인재의 강력한 파이프라인을 육성함으로써 핵심적인 역할을 수행할 수 있다"고 이스완란은 기대했다.   AISG는 IMDA, PA(People's Association), NTUC U-어소시에이츠(National Trades Union Congress U-Associates)와 같은 지역사회단체 및 파트너와 함께 AI4E 프로그램을 통해 1만 명의 사람들을 참여시킬 수 있다. AISG는 학교, 폴리테크닉대학, ITE(Institutes of Technical Education)와 협력하여 전제 조건에서 유사한 워크숍을 진행하고 있다. 이 ...

2018.08.31

'챗봇과 머신러닝으로 고객이 원하는 밴 찾아준다' 英 바나라마 이야기

시선을 끄는 TV∙라디오 광고와 영국 프로 축구 리그 후원사로 유명한 영국의 밴 리스 웹사이트인 바나라마(Vanarama)는 챗봇과 머신러닝 같은 새로운 기능을 고객들에게 좀 더 빨리 제공하기 위해 IT분야를 회사 내부로 옮겨 왔다. 바나라마에서 1년 가까이 근무해 온 수석 아키텍트 겸 CTO인 제이미 뷰캐넌은 <컴퓨터월드UK>와의 전화 인터뷰를 통해 새로운 기능을 고객에게 제공하는 방식에 있어 회사가 좀 더 민첩해질 수 있도록 수년간 아웃소싱으로 활용했던 기술 분야를 사내로 가져온 과정에 대해 이야기했다. CEO인 앤디 앨더슨의 요청에 따라 뷰캐넌은 아무런 사전 준비 없이 IT팀을 구축했다. 애자일 개발 방법론 구현과 함께 닷넷(.Net) 프레임워크에서 루비 온 레일 (Ruby on Rails)을 실행하는, 좀더 현대적인 환경으로 옮겨가는 업무 수행이 포함됐다. 그러나 뷰캐넌은 바나라마의 하트퍼드셔 본사로 데려올 기술 분야 인재를 찾는 게 어려웠다고 말했다. 그는 "런던 외곽에 있다는 것은 그런 기술자들을 찾을 때 도전하고 싶어서 떠나고자 하는 사람들을 열심히 찾아야 함을 의미했다”고 그는 설명했다. 뷰캐넌에 따르면 밴, 자동차, 보험, 회사용 운송수단을 대상으로 하는 다양한 바나라마 웹사이트는 기본적으로 모바일 기반이며 ‘소파에 있는’ 고객을 대상으로 한다. 다시 말해 사용자 참여를 유도하고 결정적으로는 판매를 촉진하려면 속도와 간편함이 필요하다는 것을 의미한다. 머신러닝 바나라마는 새로운 고객을 겨냥해서 한번 자사 판매 경로에 들어오면 더 다양한 거래를 접할 수 있게 도와주기 위해 많은 프로젝트를 진행하고 있다. 이는 좀 더 스마트한 개인화와 매칭 작업에서 시작된다. 즉, 사이트에 접속하는 고객은 보험이나 합리적인 가격 등의 이유와 상관없이 리스가 가능한 차량들만 볼 수 있게 함을 의미한다. 이런 종류의 작업은 통상 머신러닝에 의존한다. 기본적으로 바나라마는 호텔 ...

SAS 아마존웹서비스 챗봇 Qlik 루비 온 레일 ML 오픈뱅킹 세이지메이커 신용 조회 클릭 데이터 과학 닷넷 AWS IT아웃소싱 통계 CTO 모델링 페이스북 메신저 애자일 개발 보험 바나라마

2018.08.09

시선을 끄는 TV∙라디오 광고와 영국 프로 축구 리그 후원사로 유명한 영국의 밴 리스 웹사이트인 바나라마(Vanarama)는 챗봇과 머신러닝 같은 새로운 기능을 고객들에게 좀 더 빨리 제공하기 위해 IT분야를 회사 내부로 옮겨 왔다. 바나라마에서 1년 가까이 근무해 온 수석 아키텍트 겸 CTO인 제이미 뷰캐넌은 <컴퓨터월드UK>와의 전화 인터뷰를 통해 새로운 기능을 고객에게 제공하는 방식에 있어 회사가 좀 더 민첩해질 수 있도록 수년간 아웃소싱으로 활용했던 기술 분야를 사내로 가져온 과정에 대해 이야기했다. CEO인 앤디 앨더슨의 요청에 따라 뷰캐넌은 아무런 사전 준비 없이 IT팀을 구축했다. 애자일 개발 방법론 구현과 함께 닷넷(.Net) 프레임워크에서 루비 온 레일 (Ruby on Rails)을 실행하는, 좀더 현대적인 환경으로 옮겨가는 업무 수행이 포함됐다. 그러나 뷰캐넌은 바나라마의 하트퍼드셔 본사로 데려올 기술 분야 인재를 찾는 게 어려웠다고 말했다. 그는 "런던 외곽에 있다는 것은 그런 기술자들을 찾을 때 도전하고 싶어서 떠나고자 하는 사람들을 열심히 찾아야 함을 의미했다”고 그는 설명했다. 뷰캐넌에 따르면 밴, 자동차, 보험, 회사용 운송수단을 대상으로 하는 다양한 바나라마 웹사이트는 기본적으로 모바일 기반이며 ‘소파에 있는’ 고객을 대상으로 한다. 다시 말해 사용자 참여를 유도하고 결정적으로는 판매를 촉진하려면 속도와 간편함이 필요하다는 것을 의미한다. 머신러닝 바나라마는 새로운 고객을 겨냥해서 한번 자사 판매 경로에 들어오면 더 다양한 거래를 접할 수 있게 도와주기 위해 많은 프로젝트를 진행하고 있다. 이는 좀 더 스마트한 개인화와 매칭 작업에서 시작된다. 즉, 사이트에 접속하는 고객은 보험이나 합리적인 가격 등의 이유와 상관없이 리스가 가능한 차량들만 볼 수 있게 함을 의미한다. 이런 종류의 작업은 통상 머신러닝에 의존한다. 기본적으로 바나라마는 호텔 ...

2018.08.09

"지금이 기회"··· 예측 애널리틱스 착수 가이드

의심을 버려야 할 때다. 미래의 비즈니스 니즈와 기회를 포착하고 대응할 능력을 실제로 가질 수 있다. 의료, 소매, 접대, 보험 등 다양한 부문의 기업들이 재고를 최적화하고 인력을 관리하며 고객 참여도를 향상시키는데, 또 가격을 설정하거나 다른 여러 수익 창출 목표를 달성하는데 예측 애널리틱스를 활용하고 있다. 인공지능(AI)과 머신러닝(ML)의 꾸준한 발전 덕분에 예측 애널리틱스가 점차 정확하게 통찰력 을 전달하고 있다. 하지만 많은 기업들이 예측 애널리틱스를 다양한 수준으로 의심하고 있다. 이 기술이 여전히 복잡하고 너무 혁신적이며 비용이 너무 높아서 일상 용도로 통합하기에는 무리가 있다고 생각한다. 그러나 이러한 의심 속에서 예측 애널리틱스가 적어도 초기의 소규모 활용에 잘 적용되는 툴이라는 점을 인지하지 못할 때가 많다. 데이터 과학 소프트웨어 및 컨설팅 기업 시비스 애널리틱스(Civis Analytics)의 응용 데이터 과학 책임자 엘렌 휴스턴은 "예측 애널리틱스를 시작하는 것은 수영을 배우는 것과 같다. 좀 더 깊이 살펴보면 별 것 아닐 수 있다"라고 말했다. 시비스 애널리틱스는 오바마 대통령의 2012년 재선 당시 수석분석경영자를 역임한 댄 와그너(Dan Wagner)가 2013년에 에릭 슈미트(Eric Schmidt)의 지원을 받아 설립한 기업이다. 예측 애널리틱스 플랫폼 제공자인 로지 애널리틱스(Logi Analytics)의 예측 애널리틱스 책임자 스리람 파싸사라씨(Sriram Parthasarathy)는 이 기술을 이용하여 바로 이용할 수 있는 이력 데이터를 활용해 하나의 예측 문제에 대한 답을 얻게 된다면 회의론자들도 생각이 바뀔 것이라고 말했다. 그는 "그 문제의 해답을 찾는 것에 대한 ROI가 입증되면 시간이 지나면서 더 많은 데이터를 추가하여 모델을 개선해 비즈니스 워크플로의 다른 부분에 대한 새로운 통찰력을 통합할 수 있다. 이런 계획이 성공하면 기업은...

예측 애널리틱스 데이터 과학 예측적 애널리틱스

2018.06.21

의심을 버려야 할 때다. 미래의 비즈니스 니즈와 기회를 포착하고 대응할 능력을 실제로 가질 수 있다. 의료, 소매, 접대, 보험 등 다양한 부문의 기업들이 재고를 최적화하고 인력을 관리하며 고객 참여도를 향상시키는데, 또 가격을 설정하거나 다른 여러 수익 창출 목표를 달성하는데 예측 애널리틱스를 활용하고 있다. 인공지능(AI)과 머신러닝(ML)의 꾸준한 발전 덕분에 예측 애널리틱스가 점차 정확하게 통찰력 을 전달하고 있다. 하지만 많은 기업들이 예측 애널리틱스를 다양한 수준으로 의심하고 있다. 이 기술이 여전히 복잡하고 너무 혁신적이며 비용이 너무 높아서 일상 용도로 통합하기에는 무리가 있다고 생각한다. 그러나 이러한 의심 속에서 예측 애널리틱스가 적어도 초기의 소규모 활용에 잘 적용되는 툴이라는 점을 인지하지 못할 때가 많다. 데이터 과학 소프트웨어 및 컨설팅 기업 시비스 애널리틱스(Civis Analytics)의 응용 데이터 과학 책임자 엘렌 휴스턴은 "예측 애널리틱스를 시작하는 것은 수영을 배우는 것과 같다. 좀 더 깊이 살펴보면 별 것 아닐 수 있다"라고 말했다. 시비스 애널리틱스는 오바마 대통령의 2012년 재선 당시 수석분석경영자를 역임한 댄 와그너(Dan Wagner)가 2013년에 에릭 슈미트(Eric Schmidt)의 지원을 받아 설립한 기업이다. 예측 애널리틱스 플랫폼 제공자인 로지 애널리틱스(Logi Analytics)의 예측 애널리틱스 책임자 스리람 파싸사라씨(Sriram Parthasarathy)는 이 기술을 이용하여 바로 이용할 수 있는 이력 데이터를 활용해 하나의 예측 문제에 대한 답을 얻게 된다면 회의론자들도 생각이 바뀔 것이라고 말했다. 그는 "그 문제의 해답을 찾는 것에 대한 ROI가 입증되면 시간이 지나면서 더 많은 데이터를 추가하여 모델을 개선해 비즈니스 워크플로의 다른 부분에 대한 새로운 통찰력을 통합할 수 있다. 이런 계획이 성공하면 기업은...

2018.06.21

오라클, '데이터사이언스닷컴' 인수··· 자사 클라우드로 통합 예정

오라클이 리오 틴토(Rio Tinto)와 소노스(Sonos) 같은 조직에서 사용하는 플랫폼인 데이터사이언스닷컴(DataScience.com)을 인수하기로 합의했다. 오라클은 자사 클라우드에 데이터사이언스닷컴 플랫폼을 추가함으로써 오라클 클라우드 인프라와 오라클의 통합 SaaS 및 PaaS 제품을 활용하는 단일 데이터 과학 플랫폼을 제공함으로써 고객이 머신러닝의 잠재력을 활용할 수 있도록 지원하겠다고 발표했다. 데이터사이언스닷컴 플랫폼은 완전히 통제되는 작업 공간에서 데이터 과학 툴, 프로젝트, 인프라를 중앙집중화 해준다. 오라클에 따르면 데이터 과학팀은 이 플랫폼을 사용해 워크플로를 구성하고 데이터 및 컴퓨팅 리소스에 쉽게 접근하며 엔드투엔드 모델 개발 워크플로를 실행한다. 오라클 클라우드 플랫폼 부사장인 아밋 자베리는 "현재 모든 조직이 경쟁우위를 적극적으로 개발하기 위한 핵심 방법으로 데이터 과학 및 머신러닝을 탐구하고 있지만 포괄적인 툴링 및 통합된 머신러닝 기능이 부족해 이들 프로젝트가 잘 진행되지 않을 수 있다"고 말했다. 이어서 자베라는 "오라클과 데이터사이언스닷컴의 결합을 통해 고객은 단일 데이터 과학 플랫폼을 활용하여 예측 학습과 비즈니스 결과 개선을 위해 머신러닝과 빅데이터를 좀더 효과적으로 활용할 수 있게 될 것이다"고 강조했다. 이번 인수를 마무리한 후 오라클은 데이터사이언스닷컴에 계속 투자할 계획이다. 오라클은 더 빠른 속도로 더 많은 기능을 포함할 것으로 기대하고 있다. 또한 오라클에 따르면 데이터사이언스닷컴 고객은 오라클의 다른 제품과 더 잘 통합할 수 있는 이점을 누리게 될 것이다. 데이터사이언스닷컴 CEO인 이안 스완슨은 "운영을 단순화하고 규모의 가치를 제공하려면 데이터 과학에 포괄적인 플랫폼이 필요하다"며 "데이터사이언스닷컴을 통해 고객은 중요한 머신러닝 모델을 개발 환경에 있는 장벽을 제거하는 강력하고 사용하기 쉬운 플랫폼...

Saas 오라클 인수 M&A 빅데이터 PaaS IaaS 데이터 과학 데이터사이언스닷컴

2018.05.18

오라클이 리오 틴토(Rio Tinto)와 소노스(Sonos) 같은 조직에서 사용하는 플랫폼인 데이터사이언스닷컴(DataScience.com)을 인수하기로 합의했다. 오라클은 자사 클라우드에 데이터사이언스닷컴 플랫폼을 추가함으로써 오라클 클라우드 인프라와 오라클의 통합 SaaS 및 PaaS 제품을 활용하는 단일 데이터 과학 플랫폼을 제공함으로써 고객이 머신러닝의 잠재력을 활용할 수 있도록 지원하겠다고 발표했다. 데이터사이언스닷컴 플랫폼은 완전히 통제되는 작업 공간에서 데이터 과학 툴, 프로젝트, 인프라를 중앙집중화 해준다. 오라클에 따르면 데이터 과학팀은 이 플랫폼을 사용해 워크플로를 구성하고 데이터 및 컴퓨팅 리소스에 쉽게 접근하며 엔드투엔드 모델 개발 워크플로를 실행한다. 오라클 클라우드 플랫폼 부사장인 아밋 자베리는 "현재 모든 조직이 경쟁우위를 적극적으로 개발하기 위한 핵심 방법으로 데이터 과학 및 머신러닝을 탐구하고 있지만 포괄적인 툴링 및 통합된 머신러닝 기능이 부족해 이들 프로젝트가 잘 진행되지 않을 수 있다"고 말했다. 이어서 자베라는 "오라클과 데이터사이언스닷컴의 결합을 통해 고객은 단일 데이터 과학 플랫폼을 활용하여 예측 학습과 비즈니스 결과 개선을 위해 머신러닝과 빅데이터를 좀더 효과적으로 활용할 수 있게 될 것이다"고 강조했다. 이번 인수를 마무리한 후 오라클은 데이터사이언스닷컴에 계속 투자할 계획이다. 오라클은 더 빠른 속도로 더 많은 기능을 포함할 것으로 기대하고 있다. 또한 오라클에 따르면 데이터사이언스닷컴 고객은 오라클의 다른 제품과 더 잘 통합할 수 있는 이점을 누리게 될 것이다. 데이터사이언스닷컴 CEO인 이안 스완슨은 "운영을 단순화하고 규모의 가치를 제공하려면 데이터 과학에 포괄적인 플랫폼이 필요하다"며 "데이터사이언스닷컴을 통해 고객은 중요한 머신러닝 모델을 개발 환경에 있는 장벽을 제거하는 강력하고 사용하기 쉬운 플랫폼...

2018.05.18

장밋빛 기대에 찬물··· 흔한 '데이터 과학' 실수 12가지

이미 수많은 기업과 기관들이 빅데이터와 예측 분석, 자동화된 알고리즘으로 비즈니스 프로세스와 고객 지원, 의사결정을 강화하는 데 도움을 주는 도구와 서비스를 찾고 있다. IDC에 따르면, 2018년에는 기업과 ISV 개발자 가운데 75%가 최소 1개 이상의 애플리케이션(적용 분야)에 AI나 머신러닝을 사용할 전망이다. 이렇게 데이터를 활용해 의사 결정을 내리고, 성과를 향상시키는 데 많은 관심이 쏠려 있지만, 데이터 사이언스 전문가와 전문성은 아직 부족하고 미흡하다. 특히 이제 막 데이터 사이언스를 활용하는 노력을 시작했다면, 흔히 저지르는 실수들을 주의할 필요가 있다.  1. 데이터를 사용할 준비가 되었으며, 필요한 모든 것이 갖춰졌다고 가정한다 수집한 데이터의 양과 품질을 모두 학인하고, 이를 활용할 계획을 수립해야 한다. 데이터닷월드(Data.world)의 데이터 과학자 겸 지식 엔지니어인 조나단 오티즈는 “대부분의 시간, 때론 80%에 달하는 시간을 데이터 획득과 정리에 투자하게 된다. 그리고 추적해야 할 것들을 추적하고 있기 때문에, 데이터 과학자가 자신이 할 일을 할 수 있다고 가정하곤 한다”라고 말했다. 그렇지만 올바른 데이터를 추적하고 있어도 기록을 잘못하고 있을 수 있다. 또는 기록 방식이 시간이 지나면서 바뀔 수 있고, 데이터를 수집하는 동안 수집 시스템이 바뀔 수도 있다.  오티즈는 “매달 조금씩 바뀌고 있다고 가정하자. 분석을 하거나, 모델을 구축할 때 데이터 전체를 사용하지 못하게 된다. 시스템이 바뀌었기 때문이다”라고 경고했다. 테크타겟(TechTarget)의 존 스타이너트 최고 마케팅 책임자(CMO)에 따르면, 올바른 데이터를 수집하고 있어도 데이터 양이 적고 독립적인 변수의 수가 많아 B2B 마케팅과 영업 같은 비즈니스 분야를 대상으로 한 예측 모델 구축이 힘들 수도 있다. 그는 “데이터 사이언스는 데이터가 많을수록 좋고, ...

CIO 데이터 과학자 알고리즘 애널리틱스 예측 분석 데이터 과학 데이터 사이언스

2018.05.11

이미 수많은 기업과 기관들이 빅데이터와 예측 분석, 자동화된 알고리즘으로 비즈니스 프로세스와 고객 지원, 의사결정을 강화하는 데 도움을 주는 도구와 서비스를 찾고 있다. IDC에 따르면, 2018년에는 기업과 ISV 개발자 가운데 75%가 최소 1개 이상의 애플리케이션(적용 분야)에 AI나 머신러닝을 사용할 전망이다. 이렇게 데이터를 활용해 의사 결정을 내리고, 성과를 향상시키는 데 많은 관심이 쏠려 있지만, 데이터 사이언스 전문가와 전문성은 아직 부족하고 미흡하다. 특히 이제 막 데이터 사이언스를 활용하는 노력을 시작했다면, 흔히 저지르는 실수들을 주의할 필요가 있다.  1. 데이터를 사용할 준비가 되었으며, 필요한 모든 것이 갖춰졌다고 가정한다 수집한 데이터의 양과 품질을 모두 학인하고, 이를 활용할 계획을 수립해야 한다. 데이터닷월드(Data.world)의 데이터 과학자 겸 지식 엔지니어인 조나단 오티즈는 “대부분의 시간, 때론 80%에 달하는 시간을 데이터 획득과 정리에 투자하게 된다. 그리고 추적해야 할 것들을 추적하고 있기 때문에, 데이터 과학자가 자신이 할 일을 할 수 있다고 가정하곤 한다”라고 말했다. 그렇지만 올바른 데이터를 추적하고 있어도 기록을 잘못하고 있을 수 있다. 또는 기록 방식이 시간이 지나면서 바뀔 수 있고, 데이터를 수집하는 동안 수집 시스템이 바뀔 수도 있다.  오티즈는 “매달 조금씩 바뀌고 있다고 가정하자. 분석을 하거나, 모델을 구축할 때 데이터 전체를 사용하지 못하게 된다. 시스템이 바뀌었기 때문이다”라고 경고했다. 테크타겟(TechTarget)의 존 스타이너트 최고 마케팅 책임자(CMO)에 따르면, 올바른 데이터를 수집하고 있어도 데이터 양이 적고 독립적인 변수의 수가 많아 B2B 마케팅과 영업 같은 비즈니스 분야를 대상으로 한 예측 모델 구축이 힘들 수도 있다. 그는 “데이터 사이언스는 데이터가 많을수록 좋고, ...

2018.05.11

'AI가 BI를 만났을 때' 더 똑똑해지고 유용해진다

데이터 과학이 대중화되고 있다. 데이터 과학자들이 데이터를 취합하고 분석하기까지 몇 달이 걸렸지만, 이제는 현업 사용자가 신속하게 데이터를 며칠 안에 모을 수 있게 됐다. 머신러닝이 약속하는 데이터 분석을 활용에서 의외의 기술이 등장한다. 바로 비즈니스 인텔리전스(BI)다. 성과 분석 영역이었던 BI 시스템을 인공지능으로 재단장하여 기존의 보고 기능에 예측 기능까지 결합하려는 것이다. 이러한 시도를 하는 조직 중 하나가 심포니 포스트 어큐트 네트워크(Symphony Post Acute Network)다. 미국 일리노이, 인디애나, 위스콘신주 28개 의료시설에 5,000개의 침상을 보유한 의료회사인 심포니는 무릎 수술 등에서 회복 중이거나 투석 치료를 받는 연 8만 명의 환자에 대한 간호를 개선하고자 인공지능과 머신러닝을 활용하고자 했다. 예를 들면, 어떤 환자는 특히 낙상 위험이 있으므로 주의를 더욱 기울여야 한다는 점을 찾아낼 수도 있기 때문이다. 개별적인 데이터 포인트나 미묘한 데이터 패턴으로 나타날 수 있는 이러한 지표를 찾아내는 것이야말로 머신러닝의 완벽한 활용 사례다. 그러나 모델 구축 작업은 간단하지 않다. 심포니의 데이터 과학 및 분석 책임자 네이선 패트릭 테일러는 “예측에 관해 질문 공세를 받았다”고 밝혔다. “온종일 머신러닝 모델 구축에 매달린다고 해도 그 모든 것을 혼자 다 해내는 것은 불가능하다”고 덧붙였다. 심포니는 2명의 데이터 과학자를 추가로 채용했다. 테일러는 “이들의 몸값이 비싸다. 그런데 우리가 필요로 한 결과를 얻지 못하고 있었다. 매우 어렵고 비용이 많이 드는 일이었다”고 말했다. 그래서 2년 전 심포니는 외부에서 대안을 모색하기 시작했다. 즉, 이미 머신러닝 모델 구축을 마치고 활용할 준비가 된 업체를 찾았다. 이제 심포니는 자체 데이터 저장소에 들어 있던 데이터를 데이터로봇(DataRobot)이라...

CIO 알터릭스 도미노 데이터랩 트리팩타 Trifacta Alteryx Domino Data Labs 알 샤이니 R Shiny Qlik 태블로 클릭 가트너 포레스터 데이터 과학자 비즈니스 인텔리전스 엑셀 인공지능 데이터 과학 파워BI 액세츄어

2018.04.20

데이터 과학이 대중화되고 있다. 데이터 과학자들이 데이터를 취합하고 분석하기까지 몇 달이 걸렸지만, 이제는 현업 사용자가 신속하게 데이터를 며칠 안에 모을 수 있게 됐다. 머신러닝이 약속하는 데이터 분석을 활용에서 의외의 기술이 등장한다. 바로 비즈니스 인텔리전스(BI)다. 성과 분석 영역이었던 BI 시스템을 인공지능으로 재단장하여 기존의 보고 기능에 예측 기능까지 결합하려는 것이다. 이러한 시도를 하는 조직 중 하나가 심포니 포스트 어큐트 네트워크(Symphony Post Acute Network)다. 미국 일리노이, 인디애나, 위스콘신주 28개 의료시설에 5,000개의 침상을 보유한 의료회사인 심포니는 무릎 수술 등에서 회복 중이거나 투석 치료를 받는 연 8만 명의 환자에 대한 간호를 개선하고자 인공지능과 머신러닝을 활용하고자 했다. 예를 들면, 어떤 환자는 특히 낙상 위험이 있으므로 주의를 더욱 기울여야 한다는 점을 찾아낼 수도 있기 때문이다. 개별적인 데이터 포인트나 미묘한 데이터 패턴으로 나타날 수 있는 이러한 지표를 찾아내는 것이야말로 머신러닝의 완벽한 활용 사례다. 그러나 모델 구축 작업은 간단하지 않다. 심포니의 데이터 과학 및 분석 책임자 네이선 패트릭 테일러는 “예측에 관해 질문 공세를 받았다”고 밝혔다. “온종일 머신러닝 모델 구축에 매달린다고 해도 그 모든 것을 혼자 다 해내는 것은 불가능하다”고 덧붙였다. 심포니는 2명의 데이터 과학자를 추가로 채용했다. 테일러는 “이들의 몸값이 비싸다. 그런데 우리가 필요로 한 결과를 얻지 못하고 있었다. 매우 어렵고 비용이 많이 드는 일이었다”고 말했다. 그래서 2년 전 심포니는 외부에서 대안을 모색하기 시작했다. 즉, 이미 머신러닝 모델 구축을 마치고 활용할 준비가 된 업체를 찾았다. 이제 심포니는 자체 데이터 저장소에 들어 있던 데이터를 데이터로봇(DataRobot)이라...

2018.04.20

머신러닝과 예측 알고리즘에 '안성맞춤' 데이터 과학 툴 10선

기업이 과거보다 훨씬 빠르게 데이터를 다루고자 하면서 데이터 과학자들이 알고리즘을 구축하고 배포하도록 해주는 플랫폼이 점점 더 중요해지고 있다. 가트너는 데이터 과학 플랫폼을 단순히 "머신러닝 솔루션을 만드는 엔진"으로 정의한다. 이 기사에서는 가트너의 정의를 확대해 데이터 과학 업무팀이 코드를 공동 작업하고 직접 배포해 데이터 과학 솔루션을 안내할 수 있는 모든 것을 포함했다. 데이터 과학 플랫폼은 상대적으로 덜 성숙했고 아직은 묘책이 없음을 기억하는 것이 중요하다. 테셀라 애널리틱스(Tessella Analytics)의 수석 분석 전략가인 매튜 존스는 <컴퓨터월드UK(ComputerworldUK)>와의 인터뷰에서 "데이터 과학은 플러그 앤드 플레이가 아니다"고 말했다. 이어서 "플랫폼은 아웃소싱해도 괜찮다. 하지만, 존재하는 데이터와 컨텍스트를 이해하는 사람은 교육을 받아야 한다. 기술 공급 업체에게 데이터 과학을 아웃소싱하는 경우 비즈니스와 데이터를 확실히 이해해야 한다"고 밝혔다. 이를 염두에 두고 오픈소스부터 기존 솔루션 업체까지 현재 기업이 가장 많이 사용하는 데이터 과학 플랫폼을 소개한다.   1. H2O.ai H2O.ai는 기업이 비즈니스 문제에 신속하고 확장할 수 있는 예측 분석을 적용하도록 지원하는 오픈소스 시스템 학습 플랫폼이다. 이 플랫폼의 명성은 점점 더 올라가고 있으며, 이전 버전은 가트너 매직 쿼드런트에서 비저너리로 선정됐으며 2018 데이터 과학 및 머신러닝 플랫폼 매직 쿼드런트에서 리더로 꼽혔다. 가트너는 딥러닝, 머신러닝 자동화, 하이브리드 클라우드 지원, 오픈소스 통합에 대한 기술 역량과 이베이, 캐피탈원, 컴캐스트를 포함한 고객사를 위한 강력한 지원을 높이 평가했다. 코드 중심 툴체인은 뛰어난 유연성과 확장성을 제공하지만 가장 사용자 친화적인 제품은 아니다. 2. 마이크...

SAS 래피드마이너 다타이쿠 도미노 데이터랩 데이터 과학 분석 예측 기계학습 스플렁크 모델링 클라우데라 데이터 과학자 애저 마이크로소프트 IBM 가트너 빅데이터 H2O.ai

2018.04.19

기업이 과거보다 훨씬 빠르게 데이터를 다루고자 하면서 데이터 과학자들이 알고리즘을 구축하고 배포하도록 해주는 플랫폼이 점점 더 중요해지고 있다. 가트너는 데이터 과학 플랫폼을 단순히 "머신러닝 솔루션을 만드는 엔진"으로 정의한다. 이 기사에서는 가트너의 정의를 확대해 데이터 과학 업무팀이 코드를 공동 작업하고 직접 배포해 데이터 과학 솔루션을 안내할 수 있는 모든 것을 포함했다. 데이터 과학 플랫폼은 상대적으로 덜 성숙했고 아직은 묘책이 없음을 기억하는 것이 중요하다. 테셀라 애널리틱스(Tessella Analytics)의 수석 분석 전략가인 매튜 존스는 <컴퓨터월드UK(ComputerworldUK)>와의 인터뷰에서 "데이터 과학은 플러그 앤드 플레이가 아니다"고 말했다. 이어서 "플랫폼은 아웃소싱해도 괜찮다. 하지만, 존재하는 데이터와 컨텍스트를 이해하는 사람은 교육을 받아야 한다. 기술 공급 업체에게 데이터 과학을 아웃소싱하는 경우 비즈니스와 데이터를 확실히 이해해야 한다"고 밝혔다. 이를 염두에 두고 오픈소스부터 기존 솔루션 업체까지 현재 기업이 가장 많이 사용하는 데이터 과학 플랫폼을 소개한다.   1. H2O.ai H2O.ai는 기업이 비즈니스 문제에 신속하고 확장할 수 있는 예측 분석을 적용하도록 지원하는 오픈소스 시스템 학습 플랫폼이다. 이 플랫폼의 명성은 점점 더 올라가고 있으며, 이전 버전은 가트너 매직 쿼드런트에서 비저너리로 선정됐으며 2018 데이터 과학 및 머신러닝 플랫폼 매직 쿼드런트에서 리더로 꼽혔다. 가트너는 딥러닝, 머신러닝 자동화, 하이브리드 클라우드 지원, 오픈소스 통합에 대한 기술 역량과 이베이, 캐피탈원, 컴캐스트를 포함한 고객사를 위한 강력한 지원을 높이 평가했다. 코드 중심 툴체인은 뛰어난 유연성과 확장성을 제공하지만 가장 사용자 친화적인 제품은 아니다. 2. 마이크...

2018.04.19

머신러닝에 관한 9가지 오해

머신러닝만큼 오해가 많은 신기술도 없을 것이다. 머신러닝이 할 수 있는 것과 할 수 없는 것은 각각 무엇인지를 알아보고, 더 이상 머신러닝을 오해하지 말자. 머신러닝은 매우 유용하다. 그래서 모든 문제를 해결하고, 모든 상황에 적용할 수 있는 기술이라고 생각하기 쉽다. 하지만 다른 도구들처럼 특정 영역에만 유용하다. 지속되고 있지만, 이를 해결할 사람을 충분히 채용할 수 없어 해결하지 못하고 있는 문제들, 목적이 명확하지만, 이를 달성할 방법이 없는 문제들을 예로 들 수 있다. 어쨌든 많은 기업과 기관이 어떤 식이든 머신러닝을 활용해 혜택을 누릴 수 있다. 액센츄어 조사에 따르면, 2021년까지 AI가 모든 새로운 혁신의 원동력이 될 것이라고 예상한 중역들의 비율이 42%에 달한다. 그러나 ‘하이프’와 일반적인 통념을 극복하고, 머신러닝이 실제 전달할 수 있는 기능과 그렇지 못한 기능을 이해해야 더 좋은 성과를 일궈낼 수 있다. 오해 1 : ‘머신러닝=AI’다 머신러닝과 인공지능이 유사어처럼 사용되는 경우가 많다. 하지만 머신러닝은 연구 실험실에서 실제 세상으로 가장 성공적으로 진입한 기법이고, AI는 컴퓨터 비전, 로봇, 자연어 처리, 머신러닝이 관여되지 않는 제약 만족(Constraint Satisfaction) 같은 접근법 등 적용 범위와 응용 분야가 광범위한 기술이다. 머신을 똑똑하게 만드는 기술로 생각하면 된다. 이 가운데 어느 것도 일부 사람들이 경쟁할까 두려워하고, 심지어 인간을 공격할까 두려워하는 그런 '인공지능'은 아니다. ‘버즈워드(통용어)’를 경계하고, 정확히 이해해야 한다. 머신러닝은 수많은 데이터의 패턴을 학습, 결과를 예측하는 기법이다. 그 결과가 ‘지적’으로 보일지 모르겠지만, 기본적으로 아주 빠른 속도와 규모로 통계 처리를 하는 기법이다. 오해 2 : 모든 데이터가 유용하다 머신러닝에는 데이터가 ...

CIO RL 통념 CB 강화학습 신경망 알파고 딥마인드 데이터 과학 블랙박스 기계학습 마이크로소픝 API 인공지능 일자리 피싱 애저 세일즈포스 맥락 강도

2018.03.23

머신러닝만큼 오해가 많은 신기술도 없을 것이다. 머신러닝이 할 수 있는 것과 할 수 없는 것은 각각 무엇인지를 알아보고, 더 이상 머신러닝을 오해하지 말자. 머신러닝은 매우 유용하다. 그래서 모든 문제를 해결하고, 모든 상황에 적용할 수 있는 기술이라고 생각하기 쉽다. 하지만 다른 도구들처럼 특정 영역에만 유용하다. 지속되고 있지만, 이를 해결할 사람을 충분히 채용할 수 없어 해결하지 못하고 있는 문제들, 목적이 명확하지만, 이를 달성할 방법이 없는 문제들을 예로 들 수 있다. 어쨌든 많은 기업과 기관이 어떤 식이든 머신러닝을 활용해 혜택을 누릴 수 있다. 액센츄어 조사에 따르면, 2021년까지 AI가 모든 새로운 혁신의 원동력이 될 것이라고 예상한 중역들의 비율이 42%에 달한다. 그러나 ‘하이프’와 일반적인 통념을 극복하고, 머신러닝이 실제 전달할 수 있는 기능과 그렇지 못한 기능을 이해해야 더 좋은 성과를 일궈낼 수 있다. 오해 1 : ‘머신러닝=AI’다 머신러닝과 인공지능이 유사어처럼 사용되는 경우가 많다. 하지만 머신러닝은 연구 실험실에서 실제 세상으로 가장 성공적으로 진입한 기법이고, AI는 컴퓨터 비전, 로봇, 자연어 처리, 머신러닝이 관여되지 않는 제약 만족(Constraint Satisfaction) 같은 접근법 등 적용 범위와 응용 분야가 광범위한 기술이다. 머신을 똑똑하게 만드는 기술로 생각하면 된다. 이 가운데 어느 것도 일부 사람들이 경쟁할까 두려워하고, 심지어 인간을 공격할까 두려워하는 그런 '인공지능'은 아니다. ‘버즈워드(통용어)’를 경계하고, 정확히 이해해야 한다. 머신러닝은 수많은 데이터의 패턴을 학습, 결과를 예측하는 기법이다. 그 결과가 ‘지적’으로 보일지 모르겠지만, 기본적으로 아주 빠른 속도와 규모로 통계 처리를 하는 기법이다. 오해 2 : 모든 데이터가 유용하다 머신러닝에는 데이터가 ...

2018.03.23

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.13