Offcanvas

������

'역할, 책임, 연봉, 자격증으로 알아보는' 데이터 애널리스트

데이터 애널리스트는 소속 조직이 더 나은 비즈니스 의사결정을 내리는 데 도움이 되도록 데이터를 처리하는 일을 한다. 컴퓨터 프로그래밍, 수학, 통계 등 여러 분야의 기법들을 활용, 데이터를 분석 및 처리해 비즈니스 활동을 설명하고, 예측하고, 성과를 개선할 수 있는 결론을 도출한다. 모든 분석팀에서 핵심적인 역할을 하며, 수학 및 통계 분석에 정통한 제너럴리스트가 많다.   데이터 애널리스트에 대한 수요 증가 기업과 기관의 분석 역량에 대한 관심이 빠른 속도로 급증하면서, 데이터 애널리스트를 찾는 수요가 아주 많다. 지난 4월, IDC는 올해 빅데이터 및 비즈니스 애널리틱스 솔루션 매출 규모가 1,891억 달러에 도달할 예정이며, 2022년까지 2자리 수의 성장세를 유지할 것으로 내다봤다. 가트너의 저명한 VP 애널리스트인 리타 살람은 “비즈니스와 기술 변화 속도가 유례없이 빠르다. 특히 분석 분야가 그렇다. 조직은 디지털 트랜스포메이션을 추진하고 있고, 제품을 포함해 모든 비즈니스 영역에 디지털 프로세스를 추가하고 있다. 그러면서 데이터와 분석이 갈수록 중요해지고 있다”라고 설명했다. 기업은 지난 몇 년간 데이터 과학, 머신러닝, 인공지능에 초점을 맞췄다. 그러나 컨설팅회사인 카루터스 앤 잭슨(Carruthers and Jackson)의 디렉터며, 과거 네트워크 레일(Network Rail)의 최고 데이터 책임자를 지냈고, ‘최고 데이터 책임자의 플레이북(The Chief Data Officer's Playbook)’과 ‘데이터 기반 비즈니스 트랜스포메이션: 파괴와 혁신,경쟁에서 이기는 방법(Data-Driven Business Transformation: How to Disrupt, Innovate and Stay Ahead of the Competition)’이라는 책을 공동 저술한 캐롤라인 카루터스는 중심추가 애널리틱스로 다시 이동하고 있다고 주장했다. 카루터스는 “많은 사람이 머신러닝과 AI에 열광하고, 여기에 초점을 맞추면서 분...

자격증 데이터 분석가 분석 인공지능 연봉 통계 데이터 과학자 고용 빅데이터 채용 CIO 데이터 애널리스트

2019.09.27

데이터 애널리스트는 소속 조직이 더 나은 비즈니스 의사결정을 내리는 데 도움이 되도록 데이터를 처리하는 일을 한다. 컴퓨터 프로그래밍, 수학, 통계 등 여러 분야의 기법들을 활용, 데이터를 분석 및 처리해 비즈니스 활동을 설명하고, 예측하고, 성과를 개선할 수 있는 결론을 도출한다. 모든 분석팀에서 핵심적인 역할을 하며, 수학 및 통계 분석에 정통한 제너럴리스트가 많다.   데이터 애널리스트에 대한 수요 증가 기업과 기관의 분석 역량에 대한 관심이 빠른 속도로 급증하면서, 데이터 애널리스트를 찾는 수요가 아주 많다. 지난 4월, IDC는 올해 빅데이터 및 비즈니스 애널리틱스 솔루션 매출 규모가 1,891억 달러에 도달할 예정이며, 2022년까지 2자리 수의 성장세를 유지할 것으로 내다봤다. 가트너의 저명한 VP 애널리스트인 리타 살람은 “비즈니스와 기술 변화 속도가 유례없이 빠르다. 특히 분석 분야가 그렇다. 조직은 디지털 트랜스포메이션을 추진하고 있고, 제품을 포함해 모든 비즈니스 영역에 디지털 프로세스를 추가하고 있다. 그러면서 데이터와 분석이 갈수록 중요해지고 있다”라고 설명했다. 기업은 지난 몇 년간 데이터 과학, 머신러닝, 인공지능에 초점을 맞췄다. 그러나 컨설팅회사인 카루터스 앤 잭슨(Carruthers and Jackson)의 디렉터며, 과거 네트워크 레일(Network Rail)의 최고 데이터 책임자를 지냈고, ‘최고 데이터 책임자의 플레이북(The Chief Data Officer's Playbook)’과 ‘데이터 기반 비즈니스 트랜스포메이션: 파괴와 혁신,경쟁에서 이기는 방법(Data-Driven Business Transformation: How to Disrupt, Innovate and Stay Ahead of the Competition)’이라는 책을 공동 저술한 캐롤라인 카루터스는 중심추가 애널리틱스로 다시 이동하고 있다고 주장했다. 카루터스는 “많은 사람이 머신러닝과 AI에 열광하고, 여기에 초점을 맞추면서 분...

2019.09.27

딥러닝의 한 갈래 '지도학습'이란?

머신러닝은 데이터로부터 자동으로 모델을 생성하는 알고리즘이 포함된 인공지능의 한 지류다. 머신러닝의 종류는 크게 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning), 능동적 머신러닝(Active Machine Learning) 등 4가지가 있다. 강화학습과 능동적 머신러닝은 상대적으로 새롭기 때문에 이런 종류의 목록에서 생략될 때도 있다. 또한 반 지도학습(Semi-supervised Learning)도 목록에 포함해야 한다.   지도학습이란 무엇인가? 지도학습은 올바른 답변(목표 값)으로 태그된 학습 데이터부터 출발한다. 학습 과정 후 이미 태그되지 않은 유사한 데이터에 대한 답을 예측할 수 있는 조정된 웨이트를 가진 모델을 얻게 된다. 오버피팅이나 언더피팅 없이 정확도가 높은 모델을 훈련해야 한다. 정확도가 높다는 것은 손실 함수를 최적화했다는 뜻이다. 분류 문제 맥락에서 정확도는 모델이 올바른 출력을 생성하는 예의 비율이다. 오버피팅이란 모델이 관찰한 데이터와 너무 긴밀하게 연관되어 있어서 관찰하지 않은 데이터로 일반화하지 않는다는 뜻이다. 언더피팅은 모델이 데이터의 기본 트렌드를 포착할 만큼 충분히 복잡하지 않다는 뜻이다. 손실 함수는 모델의 ‘나쁨’을 반영하기 위해 선택한다. 최고의 모델을 찾기 위해 손실을 최소화한다. 수치적 (회귀) 문제의 경우 손실 함수는 MSE(Mean Square Error)인 경우가 많으며 RMSE(Root Mean Squared Error)나 RMSD(Root Mean Square Deviation)으로도 표현된다. 이는 데이터 포인트와 모델 곡선 사이의 유클리드 거리에 해당한다. 분류 (비수치적) 무제의 경우 손실 함수는 ROC 곡선 아래의 영역(AUC), 평균 정확도, 정밀도 기억, 로그 손실 등 일련의 조치 중 하나에 기초할 수 있다. (AUC와 ROC 곡선에 대한 설명은 아래를 참조한다). 오버...

통계 지도학습 비지도학습 능동적 머신러닝 Unsupervised Learning Supervised learning Active Machine Learning reinforcement learning 강화학습 신경망 데이터 정제 함수 인공지능 하이퍼파라미터

2019.06.21

머신러닝은 데이터로부터 자동으로 모델을 생성하는 알고리즘이 포함된 인공지능의 한 지류다. 머신러닝의 종류는 크게 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning), 능동적 머신러닝(Active Machine Learning) 등 4가지가 있다. 강화학습과 능동적 머신러닝은 상대적으로 새롭기 때문에 이런 종류의 목록에서 생략될 때도 있다. 또한 반 지도학습(Semi-supervised Learning)도 목록에 포함해야 한다.   지도학습이란 무엇인가? 지도학습은 올바른 답변(목표 값)으로 태그된 학습 데이터부터 출발한다. 학습 과정 후 이미 태그되지 않은 유사한 데이터에 대한 답을 예측할 수 있는 조정된 웨이트를 가진 모델을 얻게 된다. 오버피팅이나 언더피팅 없이 정확도가 높은 모델을 훈련해야 한다. 정확도가 높다는 것은 손실 함수를 최적화했다는 뜻이다. 분류 문제 맥락에서 정확도는 모델이 올바른 출력을 생성하는 예의 비율이다. 오버피팅이란 모델이 관찰한 데이터와 너무 긴밀하게 연관되어 있어서 관찰하지 않은 데이터로 일반화하지 않는다는 뜻이다. 언더피팅은 모델이 데이터의 기본 트렌드를 포착할 만큼 충분히 복잡하지 않다는 뜻이다. 손실 함수는 모델의 ‘나쁨’을 반영하기 위해 선택한다. 최고의 모델을 찾기 위해 손실을 최소화한다. 수치적 (회귀) 문제의 경우 손실 함수는 MSE(Mean Square Error)인 경우가 많으며 RMSE(Root Mean Squared Error)나 RMSD(Root Mean Square Deviation)으로도 표현된다. 이는 데이터 포인트와 모델 곡선 사이의 유클리드 거리에 해당한다. 분류 (비수치적) 무제의 경우 손실 함수는 ROC 곡선 아래의 영역(AUC), 평균 정확도, 정밀도 기억, 로그 손실 등 일련의 조치 중 하나에 기초할 수 있다. (AUC와 ROC 곡선에 대한 설명은 아래를 참조한다). 오버...

2019.06.21

'데이터과학 석사 양성' 美 상위 10대 대학은 어디?

기업이 수집하는 중요한 데이터를 사용하는 데 분석을 활용하며 이 분야가 빠르게 성장하고 있다. 데이터과학자 경력을 키우고 기업이 원하는 역량을 충족하려면 석사 학위를 취득하는 것이 좋다. 데이터과학 분야의 석사 학위는 더 고위직을 얻을 수 있는 자격을 부여하며 동일한 직종에서 경쟁할 때 다른 후보자와 차별해 준다. 데이터과학 학위 프로그램 가이드는 공립 및 비영리 대학에서 최고의 데이터과학 석사 프로그램을 제공한다. 순위는 학생 대 교수 비율, 평균 순수 비용, 학위 과정의 집중 분야 제공 여부의 3가지 범주를 기반으로 작성됐다. 다음은 미국에서 최고의 데이터과학 석사 과정을 보유한 상위 10개 학교다. 1. 퍼듀대학 : 크라넛 경영대학원 크라넛 경영대학원에서 제공하는 퍼듀대학교의 비즈니스 분석 및 정보 관리 과학 석사는 매년 6월에 시작해 3학기로 운영되는 풀타임 프로그램이다. 대학원 과정은 공급망 분석, 투자 분석 또는 기업 재무 분석의 3가지 전문 분야를 제공한다. 실습 경험과 균형 잡힌 커리큘럼을 통해 학생들에게 최신 기술과 분석 기법을 교육하도록 설계된 STEM 인증 프로그램이다. SAS, 파이썬, 미니탭(Minitab), SQL 같은 업계 관련 도구를 사용하는 방법도 배운다. 졸업 후, 대학은 비즈니스 데이터 분석을 위한 최신 모범 사례를 사용하여 실제 데이터 문제에 기술을 적용할 수 있다고 약속한다. 위치 : 인디애나주 웨스트라피엣(West Lafayette) 캠퍼스 내 또는 온라인 : 캠퍼스 출석 필수 학생 대 교수 비율 : 12 : 1 학비 : 인디애나주 내 학생은 미화 2만 9,741달러, 주 외 학생은 4만 7,786달러 집중 과정 : 공급망 분석, 투자 분석 또는 기업 재무 분석 2. 드폴대학교 드폴대학교(DePaul University)는 데이터과학 석사 과정을 제공한다. 이 프로그램에는 졸업 요건이 포함되어 있지만 실제 데이터 분석 프로젝트 완료, 예측 분석 ...

CIO MSA 데이터과학자 데이터과학 석사 R 파이썬 대학 통계 빅데이터 SAS MS in Analytics

2018.11.16

기업이 수집하는 중요한 데이터를 사용하는 데 분석을 활용하며 이 분야가 빠르게 성장하고 있다. 데이터과학자 경력을 키우고 기업이 원하는 역량을 충족하려면 석사 학위를 취득하는 것이 좋다. 데이터과학 분야의 석사 학위는 더 고위직을 얻을 수 있는 자격을 부여하며 동일한 직종에서 경쟁할 때 다른 후보자와 차별해 준다. 데이터과학 학위 프로그램 가이드는 공립 및 비영리 대학에서 최고의 데이터과학 석사 프로그램을 제공한다. 순위는 학생 대 교수 비율, 평균 순수 비용, 학위 과정의 집중 분야 제공 여부의 3가지 범주를 기반으로 작성됐다. 다음은 미국에서 최고의 데이터과학 석사 과정을 보유한 상위 10개 학교다. 1. 퍼듀대학 : 크라넛 경영대학원 크라넛 경영대학원에서 제공하는 퍼듀대학교의 비즈니스 분석 및 정보 관리 과학 석사는 매년 6월에 시작해 3학기로 운영되는 풀타임 프로그램이다. 대학원 과정은 공급망 분석, 투자 분석 또는 기업 재무 분석의 3가지 전문 분야를 제공한다. 실습 경험과 균형 잡힌 커리큘럼을 통해 학생들에게 최신 기술과 분석 기법을 교육하도록 설계된 STEM 인증 프로그램이다. SAS, 파이썬, 미니탭(Minitab), SQL 같은 업계 관련 도구를 사용하는 방법도 배운다. 졸업 후, 대학은 비즈니스 데이터 분석을 위한 최신 모범 사례를 사용하여 실제 데이터 문제에 기술을 적용할 수 있다고 약속한다. 위치 : 인디애나주 웨스트라피엣(West Lafayette) 캠퍼스 내 또는 온라인 : 캠퍼스 출석 필수 학생 대 교수 비율 : 12 : 1 학비 : 인디애나주 내 학생은 미화 2만 9,741달러, 주 외 학생은 4만 7,786달러 집중 과정 : 공급망 분석, 투자 분석 또는 기업 재무 분석 2. 드폴대학교 드폴대학교(DePaul University)는 데이터과학 석사 과정을 제공한다. 이 프로그램에는 졸업 요건이 포함되어 있지만 실제 데이터 분석 프로젝트 완료, 예측 분석 ...

2018.11.16

'챗봇과 머신러닝으로 고객이 원하는 밴 찾아준다' 英 바나라마 이야기

시선을 끄는 TV∙라디오 광고와 영국 프로 축구 리그 후원사로 유명한 영국의 밴 리스 웹사이트인 바나라마(Vanarama)는 챗봇과 머신러닝 같은 새로운 기능을 고객들에게 좀 더 빨리 제공하기 위해 IT분야를 회사 내부로 옮겨 왔다. 바나라마에서 1년 가까이 근무해 온 수석 아키텍트 겸 CTO인 제이미 뷰캐넌은 <컴퓨터월드UK>와의 전화 인터뷰를 통해 새로운 기능을 고객에게 제공하는 방식에 있어 회사가 좀 더 민첩해질 수 있도록 수년간 아웃소싱으로 활용했던 기술 분야를 사내로 가져온 과정에 대해 이야기했다. CEO인 앤디 앨더슨의 요청에 따라 뷰캐넌은 아무런 사전 준비 없이 IT팀을 구축했다. 애자일 개발 방법론 구현과 함께 닷넷(.Net) 프레임워크에서 루비 온 레일 (Ruby on Rails)을 실행하는, 좀더 현대적인 환경으로 옮겨가는 업무 수행이 포함됐다. 그러나 뷰캐넌은 바나라마의 하트퍼드셔 본사로 데려올 기술 분야 인재를 찾는 게 어려웠다고 말했다. 그는 "런던 외곽에 있다는 것은 그런 기술자들을 찾을 때 도전하고 싶어서 떠나고자 하는 사람들을 열심히 찾아야 함을 의미했다”고 그는 설명했다. 뷰캐넌에 따르면 밴, 자동차, 보험, 회사용 운송수단을 대상으로 하는 다양한 바나라마 웹사이트는 기본적으로 모바일 기반이며 ‘소파에 있는’ 고객을 대상으로 한다. 다시 말해 사용자 참여를 유도하고 결정적으로는 판매를 촉진하려면 속도와 간편함이 필요하다는 것을 의미한다. 머신러닝 바나라마는 새로운 고객을 겨냥해서 한번 자사 판매 경로에 들어오면 더 다양한 거래를 접할 수 있게 도와주기 위해 많은 프로젝트를 진행하고 있다. 이는 좀 더 스마트한 개인화와 매칭 작업에서 시작된다. 즉, 사이트에 접속하는 고객은 보험이나 합리적인 가격 등의 이유와 상관없이 리스가 가능한 차량들만 볼 수 있게 함을 의미한다. 이런 종류의 작업은 통상 머신러닝에 의존한다. 기본적으로 바나라마는 호텔 ...

SAS 아마존웹서비스 챗봇 Qlik 루비 온 레일 ML 오픈뱅킹 세이지메이커 신용 조회 클릭 데이터 과학 닷넷 AWS IT아웃소싱 통계 CTO 모델링 페이스북 메신저 애자일 개발 보험 바나라마

2018.08.09

시선을 끄는 TV∙라디오 광고와 영국 프로 축구 리그 후원사로 유명한 영국의 밴 리스 웹사이트인 바나라마(Vanarama)는 챗봇과 머신러닝 같은 새로운 기능을 고객들에게 좀 더 빨리 제공하기 위해 IT분야를 회사 내부로 옮겨 왔다. 바나라마에서 1년 가까이 근무해 온 수석 아키텍트 겸 CTO인 제이미 뷰캐넌은 <컴퓨터월드UK>와의 전화 인터뷰를 통해 새로운 기능을 고객에게 제공하는 방식에 있어 회사가 좀 더 민첩해질 수 있도록 수년간 아웃소싱으로 활용했던 기술 분야를 사내로 가져온 과정에 대해 이야기했다. CEO인 앤디 앨더슨의 요청에 따라 뷰캐넌은 아무런 사전 준비 없이 IT팀을 구축했다. 애자일 개발 방법론 구현과 함께 닷넷(.Net) 프레임워크에서 루비 온 레일 (Ruby on Rails)을 실행하는, 좀더 현대적인 환경으로 옮겨가는 업무 수행이 포함됐다. 그러나 뷰캐넌은 바나라마의 하트퍼드셔 본사로 데려올 기술 분야 인재를 찾는 게 어려웠다고 말했다. 그는 "런던 외곽에 있다는 것은 그런 기술자들을 찾을 때 도전하고 싶어서 떠나고자 하는 사람들을 열심히 찾아야 함을 의미했다”고 그는 설명했다. 뷰캐넌에 따르면 밴, 자동차, 보험, 회사용 운송수단을 대상으로 하는 다양한 바나라마 웹사이트는 기본적으로 모바일 기반이며 ‘소파에 있는’ 고객을 대상으로 한다. 다시 말해 사용자 참여를 유도하고 결정적으로는 판매를 촉진하려면 속도와 간편함이 필요하다는 것을 의미한다. 머신러닝 바나라마는 새로운 고객을 겨냥해서 한번 자사 판매 경로에 들어오면 더 다양한 거래를 접할 수 있게 도와주기 위해 많은 프로젝트를 진행하고 있다. 이는 좀 더 스마트한 개인화와 매칭 작업에서 시작된다. 즉, 사이트에 접속하는 고객은 보험이나 합리적인 가격 등의 이유와 상관없이 리스가 가능한 차량들만 볼 수 있게 함을 의미한다. 이런 종류의 작업은 통상 머신러닝에 의존한다. 기본적으로 바나라마는 호텔 ...

2018.08.09

김진철의 How-to-Big Data | 빅데이터와 인공지능 (2)

CERN이 인공지능 기술을 소환한 이유 – 2015년 LHC 데이터 과학 워크샵[3] 2015년 11월 9일, CERN의 고에너지 물리학자들과 전세계의 인공지능 기술 전문가들이 모여 CERN의 검출기 데이터 처리 및 분석에 최신 인공지능 기술을 어떻게 적용할 수 있을지 논의하는 워크샵을 열었다. 11월 9일부터 13일까지 5일간 열린 이 워크샵은 인공지능 기술이 앞으로의 과학 연구를 어떻게 바꿔 갈지 엿보게 하는 중요한 회의였다[2~3]. 이 워크샵에서 지금까지 인공지능 기술을 LHC 빅데이터를 처리, 분석에 적용한 성공 사례들이 소개되었다. 이에 더해서, LHC 빅데이터를 온전하게 활용하지 못하는 현재의 LHC 빅데이터 처리, 분석 기술의 한계를 인공지능을 이용해 어떻게 극복할 수 있을지, 그리고 인공지능 기술을 통해 극복할 수 있을 것으로 보이는 미해결 문제 및 요구사항에 대해서도 소개 되었다. 특히, 인공지능 기술이 LHC 빅데이터 분석에 줄 수 있는 많은 가능성들에 대해서 앞으로의 LHC 업그레이드 계획과 함께 열띤 토론이 이어졌다. 예전의 세번째 글에서 잠시 소개했던 것과 같이, CMS 검출기의 경우 LHC 가속기에서 충돌하는 양성자빔은 초당 4천만 번의 횟수로 원시 이벤트 데이터를 발생시킨다. 이 때문에 초당 약 1TB의 많은 원시 데이터(raw data)가 발생한다[1, 4]. 검출기 1단계 트리거(Level-1 Trigger) 하드웨어 장치에서 원시 데이터 처리에 3.2 마이크로초가 걸리며, 이 3.2 마이크로초 동안 원시 데이터를 보관, 처리할 수 있도록 Level-1 트리거의 전자회로(front-end electronics)가 설계, 제작되었다[1, 4]. 이러한 Level-1 트리거 하드웨어의 동작 특성 때문에 원시 데이터의 샘플링 빈도(sampling frequency)가 100kHZ에 불과하다. 이 얘기는 CMS 검출기에서 수집한 이벤트 원시 데이터의 약 천분의 일만 Level-1 트리거의 필터를 통과하여 ...

CIO LHC CERN 유럽입자물리학연구소 김진철 기계학습 인공지능 통계 빅데이터 구글 정보물리학

2017.08.28

CERN이 인공지능 기술을 소환한 이유 – 2015년 LHC 데이터 과학 워크샵[3] 2015년 11월 9일, CERN의 고에너지 물리학자들과 전세계의 인공지능 기술 전문가들이 모여 CERN의 검출기 데이터 처리 및 분석에 최신 인공지능 기술을 어떻게 적용할 수 있을지 논의하는 워크샵을 열었다. 11월 9일부터 13일까지 5일간 열린 이 워크샵은 인공지능 기술이 앞으로의 과학 연구를 어떻게 바꿔 갈지 엿보게 하는 중요한 회의였다[2~3]. 이 워크샵에서 지금까지 인공지능 기술을 LHC 빅데이터를 처리, 분석에 적용한 성공 사례들이 소개되었다. 이에 더해서, LHC 빅데이터를 온전하게 활용하지 못하는 현재의 LHC 빅데이터 처리, 분석 기술의 한계를 인공지능을 이용해 어떻게 극복할 수 있을지, 그리고 인공지능 기술을 통해 극복할 수 있을 것으로 보이는 미해결 문제 및 요구사항에 대해서도 소개 되었다. 특히, 인공지능 기술이 LHC 빅데이터 분석에 줄 수 있는 많은 가능성들에 대해서 앞으로의 LHC 업그레이드 계획과 함께 열띤 토론이 이어졌다. 예전의 세번째 글에서 잠시 소개했던 것과 같이, CMS 검출기의 경우 LHC 가속기에서 충돌하는 양성자빔은 초당 4천만 번의 횟수로 원시 이벤트 데이터를 발생시킨다. 이 때문에 초당 약 1TB의 많은 원시 데이터(raw data)가 발생한다[1, 4]. 검출기 1단계 트리거(Level-1 Trigger) 하드웨어 장치에서 원시 데이터 처리에 3.2 마이크로초가 걸리며, 이 3.2 마이크로초 동안 원시 데이터를 보관, 처리할 수 있도록 Level-1 트리거의 전자회로(front-end electronics)가 설계, 제작되었다[1, 4]. 이러한 Level-1 트리거 하드웨어의 동작 특성 때문에 원시 데이터의 샘플링 빈도(sampling frequency)가 100kHZ에 불과하다. 이 얘기는 CMS 검출기에서 수집한 이벤트 원시 데이터의 약 천분의 일만 Level-1 트리거의 필터를 통과하여 ...

2017.08.28

김진철의 How-to-Big Data | 빅데이터와 인공지능 (1)

LHC 실험 데이터의 복잡성과 인공지능 기술 이번 글부터 앞으로 세, 네 번에 걸쳐서 빅데이터 비즈니스에서 인공지능 기술이 왜 중요하고 어떻게 활용해야 하는지 같이 살펴보려고 한다. 최근 딥러닝이 IT 기술계에서 크게 관심을 끌면서 인공지능 기술에 관한 관심이 커졌다. 이러한 관심에 따라 딥러닝 기반의 인공지능 기술이 빅데이터를 잘 활용해야 효과가 있음은 많은 사람이 이제 알고 있는 듯하다. 그렇지만, 구체적으로 인공지능 기술이 빅데이터와 어떻게 연관이 있고 어떻게 활용해야 하는지에 대해 구체적인 방법을 전달하는 매체는 많지 않은 것으로 보인다. LHC 빅데이터 처리에 인공지능 기술이 어떻게 활용되는지 살펴보면서 빅데이터와 인공지능 기술 간의 관련성에 대해 같이 살펴보기로 하자. LHC 네 개의 검출기에서 수집하는 데이터는 최종적으로 3차원 이벤트 영상 데이터로 재구성(reconstruction)된다. 이전의 다섯 번째, 여섯 번째 글에서 자세히 설명한 대로, 검출기의 이벤트 영상들은 물리학적인 메타데이터가 추가되기 전까지는 어떤 이벤트가 어떤 종류의 입자가 만들어낸 이벤트인지 매우 알기가 어렵다. 이전의 안개상자(cloud chamber)에서 수집된 이벤트 정보를 물리학자들이 이벤트별로 판독하고 분석하는 데에 많은 시간이 걸렸다. 안개상자 데이터의 경우 2차원 평면 영상이었는데도 영상에 잡힌 각 입자의 이벤트를 하나하나 판독, 분석하는데 고도의 입자물리학 지식과 분석 작업이 필요하였다. LHC 검출기의 3차원 영상 데이터는 영상이 3차원 영상인 점도 분석을 어렵게 하지만, 데이터의 양도 안개상자 시절보다 10억 배에서 1조 배 많기 때문에 사람이 직접 데이터를 분석하는 것은 불가능하다. 검출기 원시 데이터를 이용해 1차로 재구성된 3차원 영상 데이터에 이벤트별로 어떤 입자인지 판별하여 가능성이 높은 입자 종류 및 물리학적 메타데이터를 붙이기 위해 LHC 실험에서는 당시 다른 분야에서는 생각지도 않은 방법을 시도했다. 바로 인공지능 기술의 한 종류...

CIO LHC CERN 유럽입자물리학연구소 김진철 자율주행차 기계학습 인공지능 통계 빅데이터 정보물리학

2017.07.26

LHC 실험 데이터의 복잡성과 인공지능 기술 이번 글부터 앞으로 세, 네 번에 걸쳐서 빅데이터 비즈니스에서 인공지능 기술이 왜 중요하고 어떻게 활용해야 하는지 같이 살펴보려고 한다. 최근 딥러닝이 IT 기술계에서 크게 관심을 끌면서 인공지능 기술에 관한 관심이 커졌다. 이러한 관심에 따라 딥러닝 기반의 인공지능 기술이 빅데이터를 잘 활용해야 효과가 있음은 많은 사람이 이제 알고 있는 듯하다. 그렇지만, 구체적으로 인공지능 기술이 빅데이터와 어떻게 연관이 있고 어떻게 활용해야 하는지에 대해 구체적인 방법을 전달하는 매체는 많지 않은 것으로 보인다. LHC 빅데이터 처리에 인공지능 기술이 어떻게 활용되는지 살펴보면서 빅데이터와 인공지능 기술 간의 관련성에 대해 같이 살펴보기로 하자. LHC 네 개의 검출기에서 수집하는 데이터는 최종적으로 3차원 이벤트 영상 데이터로 재구성(reconstruction)된다. 이전의 다섯 번째, 여섯 번째 글에서 자세히 설명한 대로, 검출기의 이벤트 영상들은 물리학적인 메타데이터가 추가되기 전까지는 어떤 이벤트가 어떤 종류의 입자가 만들어낸 이벤트인지 매우 알기가 어렵다. 이전의 안개상자(cloud chamber)에서 수집된 이벤트 정보를 물리학자들이 이벤트별로 판독하고 분석하는 데에 많은 시간이 걸렸다. 안개상자 데이터의 경우 2차원 평면 영상이었는데도 영상에 잡힌 각 입자의 이벤트를 하나하나 판독, 분석하는데 고도의 입자물리학 지식과 분석 작업이 필요하였다. LHC 검출기의 3차원 영상 데이터는 영상이 3차원 영상인 점도 분석을 어렵게 하지만, 데이터의 양도 안개상자 시절보다 10억 배에서 1조 배 많기 때문에 사람이 직접 데이터를 분석하는 것은 불가능하다. 검출기 원시 데이터를 이용해 1차로 재구성된 3차원 영상 데이터에 이벤트별로 어떤 입자인지 판별하여 가능성이 높은 입자 종류 및 물리학적 메타데이터를 붙이기 위해 LHC 실험에서는 당시 다른 분야에서는 생각지도 않은 방법을 시도했다. 바로 인공지능 기술의 한 종류...

2017.07.26

모두가 실패할 때 유거브가 선거 결과를 정확히 예측한 이유

영국 EU 탈퇴 국민투표와 미국 대선 결과에 대한 예측이 잇달아 빗나가면서 여론조사의 신뢰도가 심각한 타격을 받고 있다. 이런 가운데 최근 영국 선거 결과를 정확하게 예측한 조사가 있어 주목받고 있다. 바로 '유거브(YouGov)'다. LBC와 뉴스나이트(Newsnight)의 진행자 제임스 오브라이언은 “지금까지 유일한 승자는 유거브다”라고 말했다. 유거브가 이처럼 정확한 결과를 예측할 수 있었던 것은 선거구 등의 좁은 지역을 대상으로 한 여론조사에 특화된 자체 통계 모델인 MRP(Multilevel Regression and Post-stratification) 덕분이었다. 이번 여론조사에서 각 선거구 당 평균 표본 크기는 불과 75명이었다. 그러나 유거브는 MRP를 이용해 전체 의석 중 93%의 당선인을 정확히 예측했다. MRP 모델은 LSE(London School of Economics)의 교수 벤 로더데일과 스탠퍼드대학 교수 더그 리버스가 이끄는 유거브의 데이터 공학팀이 주로 개발했다. 리버스는 “75명에 대한 설문조사는 10%p 이상 오차가 발생할 가능성이 크다. 따라서 우리는 2015년에 보수당, 노동당, 스코틀랜드국민당(SNP) 등에 투표한 사람 중 2016년에 지지당을 바꾼 비율을 파악했다. 여기에 인구 통계를 더하면 예측이 훨씬 강력해진다”라고 말했다. 즉 이전의 투표 행위에 인구 통계적 정보를 더해 일반적으로 작은 표본 때문에 생기는 각 선거구에 대한 예측치 오차를 줄일 수 있다는 것이다. 실제로 이 모델은 부족한 데이터와 낮은 응답률의 한계를 보완하며 의석에 변화를 정확하게 예측해 냈다. 유거브의 MRP 모델 유거브는 이전 7일 동안의 설문조사 데이터를 이용해 응답자 프로필에 대한 변수를 현재의 투표 성향과 연계했다. 변수에는 선거구, 인구 통계, 과거의 투표자 행동, 인터뷰 날짜 등이 포함됐으며, 이를 고려해 각 투표자 유형이 특정 정당에 투표할 확률...

통계 여론조사 유거브

2017.07.14

영국 EU 탈퇴 국민투표와 미국 대선 결과에 대한 예측이 잇달아 빗나가면서 여론조사의 신뢰도가 심각한 타격을 받고 있다. 이런 가운데 최근 영국 선거 결과를 정확하게 예측한 조사가 있어 주목받고 있다. 바로 '유거브(YouGov)'다. LBC와 뉴스나이트(Newsnight)의 진행자 제임스 오브라이언은 “지금까지 유일한 승자는 유거브다”라고 말했다. 유거브가 이처럼 정확한 결과를 예측할 수 있었던 것은 선거구 등의 좁은 지역을 대상으로 한 여론조사에 특화된 자체 통계 모델인 MRP(Multilevel Regression and Post-stratification) 덕분이었다. 이번 여론조사에서 각 선거구 당 평균 표본 크기는 불과 75명이었다. 그러나 유거브는 MRP를 이용해 전체 의석 중 93%의 당선인을 정확히 예측했다. MRP 모델은 LSE(London School of Economics)의 교수 벤 로더데일과 스탠퍼드대학 교수 더그 리버스가 이끄는 유거브의 데이터 공학팀이 주로 개발했다. 리버스는 “75명에 대한 설문조사는 10%p 이상 오차가 발생할 가능성이 크다. 따라서 우리는 2015년에 보수당, 노동당, 스코틀랜드국민당(SNP) 등에 투표한 사람 중 2016년에 지지당을 바꾼 비율을 파악했다. 여기에 인구 통계를 더하면 예측이 훨씬 강력해진다”라고 말했다. 즉 이전의 투표 행위에 인구 통계적 정보를 더해 일반적으로 작은 표본 때문에 생기는 각 선거구에 대한 예측치 오차를 줄일 수 있다는 것이다. 실제로 이 모델은 부족한 데이터와 낮은 응답률의 한계를 보완하며 의석에 변화를 정확하게 예측해 냈다. 유거브의 MRP 모델 유거브는 이전 7일 동안의 설문조사 데이터를 이용해 응답자 프로필에 대한 변수를 현재의 투표 성향과 연계했다. 변수에는 선거구, 인구 통계, 과거의 투표자 행동, 인터뷰 날짜 등이 포함됐으며, 이를 고려해 각 투표자 유형이 특정 정당에 투표할 확률...

2017.07.14

'유용하면서도 위험한' 로봇의 이중성

로봇은 우리를 위해 좋은 일을 해야 한다. 하지만 사물인터넷(Internet of Things, IoT)을 구성하는 수십억 개의 연결된 기기들처럼 로봇 기술의 발전을 통해 엄청난 기능이 추가되고 있지만, 보안은 그렇지 못하다는 많은 증거가 있다. 지난달 보안 조사 기업 IO액티브(IOActive)가 공개한 가정, 비즈니스, 산업용 로봇에 대한 보고서에 따르면, 대부분 로봇에 전문가들이 말하는 ‘기본적인 보안 하이진(hygiene)’이 빠져 있다. 여기에는 안전하지 못한 통신채널, 평문으로 전송되거나 부실한 암호화가 적용된 필수정보, 사용자 이름 또는 비밀번호를 요구하지 않는 일부 서비스, 부실한 인증, 소프트웨어 설치나 업데이트 등의 필수 기능을 보호하기 위한 충분한 인증 부재 등이 포함된다. 이 모든 것을 통해 누구든 원격으로 손쉽게 로봇을 해킹하고 허가 없이 소프트웨어를 설치해 완전한 통제력을 확보할 수 있다. 이밖에도 모바일 애플리케이션이 사용자 동의 없이 원격 서버에 ‘모바일 네트워크 정보, 장치 정보, 현재 GPS 위치’ 등의 개인정보를 전송해 이 정보가 감시 및 추적을 목적으로 사용될 수 있다고 해당 보고서는 전했다. 그리고 사용자들은 많은 IoT 스마트 기기에서 그랬던 것처럼, 로봇의 보안 구멍을 막을 만큼 현명하지 않다. 이 보고서의 저자인 CTO 세사 세루도와 수석 보안 컨설턴트 루카스 아파는 “손쉽게 비활성화하거나 보호할 수 없는 안전하지 못한 기능뿐 아니라 변경하기 어렵거나 변경할 수 없는 기본 비밀번호가 적용된 기능들이 로봇에 있음을 발견했다”고 밝혔다. 로봇 해킹으로 감시, 부상, 심지어 사망하는 일까지 발생할 수 있다. 세루도와 아파는 미국 노동부(Department of Labor)의 ‘사망으로 이어진 로봇 사고’ 통계를 인용했다. 그것은 사고였다 IO액티브의 보고서 ‘스카이넷 이전의 로...

CSO 살해 security hygiene IO액티브 미국 노동부 살인 사물인터넷 로봇 통계 IBM 해킹 부상

2017.04.11

로봇은 우리를 위해 좋은 일을 해야 한다. 하지만 사물인터넷(Internet of Things, IoT)을 구성하는 수십억 개의 연결된 기기들처럼 로봇 기술의 발전을 통해 엄청난 기능이 추가되고 있지만, 보안은 그렇지 못하다는 많은 증거가 있다. 지난달 보안 조사 기업 IO액티브(IOActive)가 공개한 가정, 비즈니스, 산업용 로봇에 대한 보고서에 따르면, 대부분 로봇에 전문가들이 말하는 ‘기본적인 보안 하이진(hygiene)’이 빠져 있다. 여기에는 안전하지 못한 통신채널, 평문으로 전송되거나 부실한 암호화가 적용된 필수정보, 사용자 이름 또는 비밀번호를 요구하지 않는 일부 서비스, 부실한 인증, 소프트웨어 설치나 업데이트 등의 필수 기능을 보호하기 위한 충분한 인증 부재 등이 포함된다. 이 모든 것을 통해 누구든 원격으로 손쉽게 로봇을 해킹하고 허가 없이 소프트웨어를 설치해 완전한 통제력을 확보할 수 있다. 이밖에도 모바일 애플리케이션이 사용자 동의 없이 원격 서버에 ‘모바일 네트워크 정보, 장치 정보, 현재 GPS 위치’ 등의 개인정보를 전송해 이 정보가 감시 및 추적을 목적으로 사용될 수 있다고 해당 보고서는 전했다. 그리고 사용자들은 많은 IoT 스마트 기기에서 그랬던 것처럼, 로봇의 보안 구멍을 막을 만큼 현명하지 않다. 이 보고서의 저자인 CTO 세사 세루도와 수석 보안 컨설턴트 루카스 아파는 “손쉽게 비활성화하거나 보호할 수 없는 안전하지 못한 기능뿐 아니라 변경하기 어렵거나 변경할 수 없는 기본 비밀번호가 적용된 기능들이 로봇에 있음을 발견했다”고 밝혔다. 로봇 해킹으로 감시, 부상, 심지어 사망하는 일까지 발생할 수 있다. 세루도와 아파는 미국 노동부(Department of Labor)의 ‘사망으로 이어진 로봇 사고’ 통계를 인용했다. 그것은 사고였다 IO액티브의 보고서 ‘스카이넷 이전의 로...

2017.04.11

기고 | 엉터리 데이터 분석에 주의하라

한 잔의 와인이 체육관에서 한 시간 동안 운동하는 것만큼 건강에 좋다는 이야기가 있다. 임신한 여성에게 초콜릿 다이어트 유익하다는 연구 결과도 화제를 모았다. 자살, 교살, 질식이 미국의 과학, 우주, 기술에 대한 지출과 상관 관계가 높다는 결과가 나오기도 했다. 비즈니스/데이터 분석 부문에 종사하는 전문가들은 이런 괴상하지만 그리 틀리지 않은 연구들에 공통점이 있다는 사실을 잘 알고 있다. 변수들 사이의 상관 관계(correlations )를 나타내는 데이터와 인과성(causality)을 수립하는 데이터를 구분하지 못한다는 것이다. 이런 혼동으로 인해 임신한 여성이 허쉬(Hershey) 초코바를 한두 개 더 먹는다면 그리 심각한 결과로 이어지지 않을 것이다. 그러나 회사가 이런 혼동에 기반해 판단한다면 성과에 치명적일 수 있다. 데이터 분석을 연구하고 가르치는 교수로서 필자는 이런 문제를 반복적으로 목격하고 있다. 일부 비즈니스 사례를 소개한다. Image Credit : Getty Images Bank 쿠폰 남발 고객이 더 많은 제품을 구매하도록 유도하기 위해 우편, 이메일, 모바일 기기로 쿠폰을 전송하곤 한다. 보편적인 마케팅 방법이다. 이 기법의 마케팅 효과를 평가하기 위해 기업들은 보편적으로 단순한 통계 모델을 구성한다. 통계 부서에서 쿠폰을 사용한 고객과 그렇지 않은 고객의 구매 차이를 측정하도록 지시하는 식이다. 그러나 (실제 마케팅 전략에 대해 아는 것이 거의 없는 통계 전문가에게 맡긴) 이런 분석은 쿠폰이 충성 고객들에게 전송되는 경우가 많다는 사실을 고려하지 않은 경우가 많다. 즉 쿠폰이 없을 때 이들 충성 고객으로부터 얻었을 매출을 감안하지 않는 한 분석은 실제 ‘쿠폰 효과’를 과장하기 쉽다. 결국 데이터에 기반해 새로운 전략을 수립한 이 기업은 ‘쿠폰을 남발’하고 불필요한 손해를 입을 것이다. 가격 정책 왜곡 가격 정책은 상관 관계/인과 혼동(corre...

실수 통계 상관관계 데이터 분석 애널리틱스 인과관계

2016.11.11

한 잔의 와인이 체육관에서 한 시간 동안 운동하는 것만큼 건강에 좋다는 이야기가 있다. 임신한 여성에게 초콜릿 다이어트 유익하다는 연구 결과도 화제를 모았다. 자살, 교살, 질식이 미국의 과학, 우주, 기술에 대한 지출과 상관 관계가 높다는 결과가 나오기도 했다. 비즈니스/데이터 분석 부문에 종사하는 전문가들은 이런 괴상하지만 그리 틀리지 않은 연구들에 공통점이 있다는 사실을 잘 알고 있다. 변수들 사이의 상관 관계(correlations )를 나타내는 데이터와 인과성(causality)을 수립하는 데이터를 구분하지 못한다는 것이다. 이런 혼동으로 인해 임신한 여성이 허쉬(Hershey) 초코바를 한두 개 더 먹는다면 그리 심각한 결과로 이어지지 않을 것이다. 그러나 회사가 이런 혼동에 기반해 판단한다면 성과에 치명적일 수 있다. 데이터 분석을 연구하고 가르치는 교수로서 필자는 이런 문제를 반복적으로 목격하고 있다. 일부 비즈니스 사례를 소개한다. Image Credit : Getty Images Bank 쿠폰 남발 고객이 더 많은 제품을 구매하도록 유도하기 위해 우편, 이메일, 모바일 기기로 쿠폰을 전송하곤 한다. 보편적인 마케팅 방법이다. 이 기법의 마케팅 효과를 평가하기 위해 기업들은 보편적으로 단순한 통계 모델을 구성한다. 통계 부서에서 쿠폰을 사용한 고객과 그렇지 않은 고객의 구매 차이를 측정하도록 지시하는 식이다. 그러나 (실제 마케팅 전략에 대해 아는 것이 거의 없는 통계 전문가에게 맡긴) 이런 분석은 쿠폰이 충성 고객들에게 전송되는 경우가 많다는 사실을 고려하지 않은 경우가 많다. 즉 쿠폰이 없을 때 이들 충성 고객으로부터 얻었을 매출을 감안하지 않는 한 분석은 실제 ‘쿠폰 효과’를 과장하기 쉽다. 결국 데이터에 기반해 새로운 전략을 수립한 이 기업은 ‘쿠폰을 남발’하고 불필요한 손해를 입을 것이다. 가격 정책 왜곡 가격 정책은 상관 관계/인과 혼동(corre...

2016.11.11

칼럼 | 예측 엇나간 미 대선, 왜 데이터가 실패한 것일까?

필자는 불과 나흘 전인 지난 일요일, 모든 데이터가 뚜렷이 힐러리 클린턴 민주당 대선 후보의 낙승을 가리키고 있다고 자신만만하게 말했다. 블로그에도 썼다. 필자뿐 아니었다. 대다수 여론 조사도 비슷한 결과를 냈다. 정치 데이터 전문 분석과 관련 모델도 같은 결론을 발표했다. 무엇이 문제였을까? 물론 정치적인 면에서 패인을 찾을 수는 있다. 그러나 데이터 과학적 관점에서는 이런 기록적인 데이터 기반 분석의 대실패에서 어떤 교훈을 얻는 것에 더 관심이 있다. 핵심은 대선 전망이라는 불확실성의 성격을 완전히 이해하지 못한 데에 있다고 본다. 데이터를 분석해 예측을 하려는 모든 사람에게 적용되는 교훈이라 할 수 있다. 일반 대중의 온도를 측정할 경우에는 상대적으로 간단하다. 인구 중 무작위 샘플을 취하고, 이 샘플이 일반인을 대표하도록 정확을 기한 후, 한쪽에 치우치지 않은 중립적 질문을 던지고 답변을 모아 통계적 계산을 하면 된다. 그러나 대통령 선거를 전망할 때는 이것만으로는 안 된다. ‘대중 전체’의 여론을 측정하는 것과 ‘실제로 투표장에 갈 사람들’의 여론을 측정하는 것은 완전히 다르기 때문이다. 그러니 하나도 아닌 두 가지의 복잡성이 존재하는 셈이다. 추출한 샘플이 평균 대중의 의사를 적절하게 반영할 뿐 아니라 실제로 투표장에 나와 표를 던질 사람들이 누군지도 정확히 가려내야 하는 것이다. 투표할 것이라고 말하면서도 실제로는 하지 않는 사람도 많다. 쉽게 간과하는 요소가 또 있다. 미국 내 투표권이 사실상 평등한 권리가 아니라는 점이다. 한 연구는 소수자 유권자들이 투표하기 위해서 백인 유권자보다 6배나 더 오래 기다려야 한다는 연구 결과도 발표됐다. 투표장에 갈 생각이 있어도 막상 너무 오래 기다려야 하기 때문에 실제 행동에 제약을 받는 것이다. 이런 요인도 투표장에 가려는 유권자와 실제 투표 결과의 괴리를 설명하는 한 가지 원인이다. 그러나 이번 미국 대통령 선거인단 투표에서 이들...

데이터 통계 대선 선거 대통령 클린턴 트럼프 여론조사

2016.11.11

필자는 불과 나흘 전인 지난 일요일, 모든 데이터가 뚜렷이 힐러리 클린턴 민주당 대선 후보의 낙승을 가리키고 있다고 자신만만하게 말했다. 블로그에도 썼다. 필자뿐 아니었다. 대다수 여론 조사도 비슷한 결과를 냈다. 정치 데이터 전문 분석과 관련 모델도 같은 결론을 발표했다. 무엇이 문제였을까? 물론 정치적인 면에서 패인을 찾을 수는 있다. 그러나 데이터 과학적 관점에서는 이런 기록적인 데이터 기반 분석의 대실패에서 어떤 교훈을 얻는 것에 더 관심이 있다. 핵심은 대선 전망이라는 불확실성의 성격을 완전히 이해하지 못한 데에 있다고 본다. 데이터를 분석해 예측을 하려는 모든 사람에게 적용되는 교훈이라 할 수 있다. 일반 대중의 온도를 측정할 경우에는 상대적으로 간단하다. 인구 중 무작위 샘플을 취하고, 이 샘플이 일반인을 대표하도록 정확을 기한 후, 한쪽에 치우치지 않은 중립적 질문을 던지고 답변을 모아 통계적 계산을 하면 된다. 그러나 대통령 선거를 전망할 때는 이것만으로는 안 된다. ‘대중 전체’의 여론을 측정하는 것과 ‘실제로 투표장에 갈 사람들’의 여론을 측정하는 것은 완전히 다르기 때문이다. 그러니 하나도 아닌 두 가지의 복잡성이 존재하는 셈이다. 추출한 샘플이 평균 대중의 의사를 적절하게 반영할 뿐 아니라 실제로 투표장에 나와 표를 던질 사람들이 누군지도 정확히 가려내야 하는 것이다. 투표할 것이라고 말하면서도 실제로는 하지 않는 사람도 많다. 쉽게 간과하는 요소가 또 있다. 미국 내 투표권이 사실상 평등한 권리가 아니라는 점이다. 한 연구는 소수자 유권자들이 투표하기 위해서 백인 유권자보다 6배나 더 오래 기다려야 한다는 연구 결과도 발표됐다. 투표장에 갈 생각이 있어도 막상 너무 오래 기다려야 하기 때문에 실제 행동에 제약을 받는 것이다. 이런 요인도 투표장에 가려는 유권자와 실제 투표 결과의 괴리를 설명하는 한 가지 원인이다. 그러나 이번 미국 대통령 선거인단 투표에서 이들...

2016.11.11

칼럼 | '트럼프가 진다'… 데이터 분석 역량에서 승패 갈릴 전망

칼럼니스트 롭 엔덜이 미국 대선에 대해 ‘힐러리 클린턴이 대통령이 된다’고 전망했다. 엔덜이 이러한 전망을 뒷받침하는 논거에 대해 알아 보자.  Credit: iStockphoto 지난 대통령 선거에서 버락 오바마의 IT팀 역량이 선거 결과만큼 롬니 팀을 큰 차이로 압도한 것은 아니었다. 도널드 트럼프가 지적했듯, 롬니가 실패한 것은 큰 실수 때문이다. 구체적으로 3가지 실수다. 첫째, 선거 흐름을 제대로 파악하지 못한 분석(애널리틱스) 서비스를 이용하는 실수를 저질렀다. 둘째, 다양한 서비스를 이용했는데 이것들이 서로 잘 호환되지 않았다. 셋째, 조사 결과가 자신들이 듣고 싶어했던 것을 말해줬다는 이유로 여기에 아무런 의문을 제기하지 않았다. 이 가운데 마지막은 계속해서 반복되는 문제다. 기업도 같은 실수를 저지르곤 한다. 그런데 트럼프도 이런 실수를 명백하게 되풀이하고 있다. 롬니에게 호통을 친 장본인인 그가 같은 실수를 되풀이한다는 것은 아이러니하다. 아마 롬니도 트럼프가 선거에 패하게 되면, 그렇게 처참하게 질 이유가 없었다고 호통을 칠 수 있게 될지도 모르겠다. 여담이지만, 트럼프의 패배는 여기에 정치 인생을 건 테드 크루즈(공화당 경선에서 트럼프에게 패배했음)가 원하는 결과다. ->시스코·델·MS가 지지하는 미 대선 후보는? 후원금으로 본 IT민심 데이터의 중요성 간과하는 트럼프 애드위크(AdWeek) 기사는 아주 흔한 문제점과 교훈을 알려준다. '숫자(통계)'가 경영진의 시각과 일치하면, 경영진을 이를 좋아한다. 그렇지 않으면 숫자에 잘못된 부분이 있는 것이 분명하다고 생각한다. 오해하지 말기 바란다. 최근 KPMG 보고서에 따르면, CEO 절반 이상이 분석 결과를 믿지 않는 것으로 나타났다. 트럼프도 이런 CEO 중 하나일 수 있다. 어쨌든 이는 어리석은 결론이다. 숫자를 더 잘 이해하거나, 숫자를 신뢰할 수 있게 하는 것이 옳은 방법...

CIO 도널드 트럼프 힐러리 클린턴 Rob Enderle 미트 롬니 미국 대선 대통령 선거 분석 롭 엔덜 버락 오바마 통계 빅데이터 브렉시트

2016.07.26

칼럼니스트 롭 엔덜이 미국 대선에 대해 ‘힐러리 클린턴이 대통령이 된다’고 전망했다. 엔덜이 이러한 전망을 뒷받침하는 논거에 대해 알아 보자.  Credit: iStockphoto 지난 대통령 선거에서 버락 오바마의 IT팀 역량이 선거 결과만큼 롬니 팀을 큰 차이로 압도한 것은 아니었다. 도널드 트럼프가 지적했듯, 롬니가 실패한 것은 큰 실수 때문이다. 구체적으로 3가지 실수다. 첫째, 선거 흐름을 제대로 파악하지 못한 분석(애널리틱스) 서비스를 이용하는 실수를 저질렀다. 둘째, 다양한 서비스를 이용했는데 이것들이 서로 잘 호환되지 않았다. 셋째, 조사 결과가 자신들이 듣고 싶어했던 것을 말해줬다는 이유로 여기에 아무런 의문을 제기하지 않았다. 이 가운데 마지막은 계속해서 반복되는 문제다. 기업도 같은 실수를 저지르곤 한다. 그런데 트럼프도 이런 실수를 명백하게 되풀이하고 있다. 롬니에게 호통을 친 장본인인 그가 같은 실수를 되풀이한다는 것은 아이러니하다. 아마 롬니도 트럼프가 선거에 패하게 되면, 그렇게 처참하게 질 이유가 없었다고 호통을 칠 수 있게 될지도 모르겠다. 여담이지만, 트럼프의 패배는 여기에 정치 인생을 건 테드 크루즈(공화당 경선에서 트럼프에게 패배했음)가 원하는 결과다. ->시스코·델·MS가 지지하는 미 대선 후보는? 후원금으로 본 IT민심 데이터의 중요성 간과하는 트럼프 애드위크(AdWeek) 기사는 아주 흔한 문제점과 교훈을 알려준다. '숫자(통계)'가 경영진의 시각과 일치하면, 경영진을 이를 좋아한다. 그렇지 않으면 숫자에 잘못된 부분이 있는 것이 분명하다고 생각한다. 오해하지 말기 바란다. 최근 KPMG 보고서에 따르면, CEO 절반 이상이 분석 결과를 믿지 않는 것으로 나타났다. 트럼프도 이런 CEO 중 하나일 수 있다. 어쨌든 이는 어리석은 결론이다. 숫자를 더 잘 이해하거나, 숫자를 신뢰할 수 있게 하는 것이 옳은 방법...

2016.07.26

'누구를 뽑아야 하나?' 빅데이터 인재 채용 전략 팁

데이터 과학자, 애널리스트, 엔지니어 채용은 어려운 일이 될 수 있다. 하지만 전략만 제대로 세운다면 지금 당장 훌륭한 후보군을 찾을 수 있을 것이다. 이미지 출처 : IDG 데이터 과학은 '핫'한 새로운 산업이다. 그런데 이 분야에 진출할 때 필요한 학력이나 경력과 기술력(전문성 또는 역량)은 무엇일까? 데이터 과학, 데이터 엔지니어링, 데이터 분석(애널리틱스)은 데이터 분석 세계에서 수많은 기술력과 직종을 설명할 때 쓰이는 광범위하면서도 때론 모호한 용어다. 데이터사이언스(DataScience)의 수석 데이터 과학자인 카일 폴리치는 "여러 다양한 조직에서 '데이터 과학자'라는 직종을 정말 광범위하게 적용하고 있다. 이런 이유로 필수 기술력을 명확하게 정의하기 힘들다. 높은 수준에서 조직 데이터를 접근, 변환, 분석, 활용하는 기법과 도구에 정통한 사람이 데이터 과학자다"고 설명했다. 데이터 과학자나 애널리스트를 채용할 계획이 있다면, 채용하려는 인재에게 요구하는 기술력이 무엇인지 아는 것이 중요하다. 데이터 직종은 데이터를 넘어서 수많은 일을 처리해야 하는 때가 많다. 그리고 수집에서 저장, 비즈니스 변혁을 위해 데이터를 분석해 활용하는 프로세스의 각 단계를 전담하는 사람들이 있다. 궁극적으로 알고리즘을 작성하며, 데이터를 관리하고 대조하며, 데이터를 해석하고, 데이터를 중요한 이해당사자와 공유하는 수많은 인재들이 데이터 전략을 성공으로 이끌 수 있다. --------------------------------------------------------------- 빅 데이터 전문 인력 인기기사 ->빅 데이터 고공행진, 하둡 전문가 '귀하신 몸' -> 연봉 높고 인기 많은 빅 데이터 전문직 8종 ->“하둡보다 25% 빠르다” 렉시스넥시스, 개발자 유인 주력 -> 뜨는 직종 '데이터 과학자...

CIO 데이터 웨어하우징 엔지니어 채용 디지털 변혁 머신러닝 분석 모델링 통계 데이터 과학자 애널리스트 고용 채용 디지털 변환

2016.06.24

데이터 과학자, 애널리스트, 엔지니어 채용은 어려운 일이 될 수 있다. 하지만 전략만 제대로 세운다면 지금 당장 훌륭한 후보군을 찾을 수 있을 것이다. 이미지 출처 : IDG 데이터 과학은 '핫'한 새로운 산업이다. 그런데 이 분야에 진출할 때 필요한 학력이나 경력과 기술력(전문성 또는 역량)은 무엇일까? 데이터 과학, 데이터 엔지니어링, 데이터 분석(애널리틱스)은 데이터 분석 세계에서 수많은 기술력과 직종을 설명할 때 쓰이는 광범위하면서도 때론 모호한 용어다. 데이터사이언스(DataScience)의 수석 데이터 과학자인 카일 폴리치는 "여러 다양한 조직에서 '데이터 과학자'라는 직종을 정말 광범위하게 적용하고 있다. 이런 이유로 필수 기술력을 명확하게 정의하기 힘들다. 높은 수준에서 조직 데이터를 접근, 변환, 분석, 활용하는 기법과 도구에 정통한 사람이 데이터 과학자다"고 설명했다. 데이터 과학자나 애널리스트를 채용할 계획이 있다면, 채용하려는 인재에게 요구하는 기술력이 무엇인지 아는 것이 중요하다. 데이터 직종은 데이터를 넘어서 수많은 일을 처리해야 하는 때가 많다. 그리고 수집에서 저장, 비즈니스 변혁을 위해 데이터를 분석해 활용하는 프로세스의 각 단계를 전담하는 사람들이 있다. 궁극적으로 알고리즘을 작성하며, 데이터를 관리하고 대조하며, 데이터를 해석하고, 데이터를 중요한 이해당사자와 공유하는 수많은 인재들이 데이터 전략을 성공으로 이끌 수 있다. --------------------------------------------------------------- 빅 데이터 전문 인력 인기기사 ->빅 데이터 고공행진, 하둡 전문가 '귀하신 몸' -> 연봉 높고 인기 많은 빅 데이터 전문직 8종 ->“하둡보다 25% 빠르다” 렉시스넥시스, 개발자 유인 주력 -> 뜨는 직종 '데이터 과학자...

2016.06.24

신간 | 빅데이터 통계 분석과 그래픽용 프로그래밍 언어의 대표 주자! 오픈소스 R

영국 팩트퍼블리싱(Packt Publishing)에서 출판된 <Mastering Scientific Computing with R>의 번역서인 <빅데이터 통계 분석과 그래픽용 프로그래밍 언어의 대표 주자! 오픈소스 R>이 발간됐다. 성안당이 출판한 이 책은 기본적인 R 개념부터 그룹간 차이 및 모델의 유의성을 통계학적으로 검정하는 등 과학 데이터 분석에 공통으로 필요한 업무를 해내는데 R을 어떻게 활용할 수 있는지를 다루고 있다. 이 책은 의사이자 의료 연구원 겸 교수인 폴 제라드와 면역학 박사이자 연구과학자인 라디아 M. 존슨이 공동 집필했다. 저자들에 따르면, R은 통계 공통어로 대량의 데이터를 기반으로 하는 일반 회사의 마케팅 툴뿐 아니라 보건, 의료 분야에서도 널리 활용되고 있다. 번역에는 외국어대학교 통계학과 교수 겸 데이터시각화연구센터장인 최대우 교수와 같은 대학 통계학과 교수인 정석오 교수가 공동으로 참여했다. 독자들은 <빅데이터 통계 분석과 그래픽용 프로그래밍 언어의 대표 주자! 오픈소스 R>을 읽으며 R로 데이터 관리, 모수적 모형과 비모수적 모형을 이용한 가설 검정, 선형 방법을 사용한 통계 모델링, 커널 회귀법으로 데이터 비선형 관계 모델링 등을 공부할 수 있다. R 프로그래밍 경험이 없는 독자라 해도 이 책에 입문할 수 있으며 이 책을 다 읽고 나서는 통계 용어와 R을 접목하는 데 익숙해질 것이다. 이 책에 나오는 모든 컬러 차트와 소스는 성안당 자료실에서 다운받을 수 있다. 448쪽, 2만 8,000원이다. ciokr@idg.co.kr  

빅데이터 통계 신간 분석 R 폴 제라드 라디아 M. 존슨 최대우 정석오

2016.03.22

영국 팩트퍼블리싱(Packt Publishing)에서 출판된 <Mastering Scientific Computing with R>의 번역서인 <빅데이터 통계 분석과 그래픽용 프로그래밍 언어의 대표 주자! 오픈소스 R>이 발간됐다. 성안당이 출판한 이 책은 기본적인 R 개념부터 그룹간 차이 및 모델의 유의성을 통계학적으로 검정하는 등 과학 데이터 분석에 공통으로 필요한 업무를 해내는데 R을 어떻게 활용할 수 있는지를 다루고 있다. 이 책은 의사이자 의료 연구원 겸 교수인 폴 제라드와 면역학 박사이자 연구과학자인 라디아 M. 존슨이 공동 집필했다. 저자들에 따르면, R은 통계 공통어로 대량의 데이터를 기반으로 하는 일반 회사의 마케팅 툴뿐 아니라 보건, 의료 분야에서도 널리 활용되고 있다. 번역에는 외국어대학교 통계학과 교수 겸 데이터시각화연구센터장인 최대우 교수와 같은 대학 통계학과 교수인 정석오 교수가 공동으로 참여했다. 독자들은 <빅데이터 통계 분석과 그래픽용 프로그래밍 언어의 대표 주자! 오픈소스 R>을 읽으며 R로 데이터 관리, 모수적 모형과 비모수적 모형을 이용한 가설 검정, 선형 방법을 사용한 통계 모델링, 커널 회귀법으로 데이터 비선형 관계 모델링 등을 공부할 수 있다. R 프로그래밍 경험이 없는 독자라 해도 이 책에 입문할 수 있으며 이 책을 다 읽고 나서는 통계 용어와 R을 접목하는 데 익숙해질 것이다. 이 책에 나오는 모든 컬러 차트와 소스는 성안당 자료실에서 다운받을 수 있다. 448쪽, 2만 8,000원이다. ciokr@idg.co.kr  

2016.03.22

선도기업들이 말하는 빅데이터 인재 확보 전략

A.T. 커니의 최근 조사에 따르면, 기업들은 통찰력을 얻기 위해 기업 데이터를 자유자재로 다룰 우수 데이터 과학자 채용에 어려움을 겪는 것으로 나타났다.  이미지 출처 : Thinkstock 빅데이터를 분석할 수 있는 숙련된 인력 부족 이외에 불필요한 정보를 제거해야 하다는 문제가 더해지면서 CIO들이 지속적으로 어려움을 겪고 있다. 430명의 고위 임원을 대상으로 한 A.T. 커니의 새로운 조사에 따르면, 가장 발전된 분석 역량을 갖춘 기업조차도 데이터에서 통찰력을 만들어 낼 수 있는 인력을 충분히 고용하지 못한 기업들이 2/3에 이르는 것으로 파악됐다. 또 기업들은 향후 5년 동안 33%나 많은 빅데이터 인재를 필요로 하게 될 것이라고 A.T. 커니의 파트너 겸 해당 연구 보고서의 공동 저자 칼리드 칸(왼쪽 사진)은 말했다. 데이터 분석 전문 인재를 채용해 이들이 회사에 남아 있도록 하는 것은 쉽지 않다. 기업들이 사업을 디지털화하면서 제품을 다듬거나 프로세스 효율성을 높이거나 새로운 수익원을 찾는데 도움이 되는 상관관계에 관한 결과 데이터 수집이 필수적이다. 예를 들어, 웨더컴퍼니(Weather Company)는 소매 기업들이 물 재고량 증감을 예측할 수 있도록 날씨 패턴을 예측하는 방법을 고민하고 있다. 문제는 빅데이터의 비즈니스 사례는 무한한 것처럼 보이지만 인재풀은 여전히 작다는 데 있다.  데이터 분석 인재에 대한 3가지 위협 조사에서 칸은 기업들이 통계, 디지털 기술, 비즈니스 전략 이 3가지를 모두 제대로 이해하고 있는 사람들을 필요로 한다고 말했다. “이 3가지 자격을 갖춘 전문가는 의사결정 과정에 데이터 분석을 통합시켜 비즈니스 전략을 수립하고 경쟁우위를 이끌어 내는 전문가들이다. 이들을 확보하는 것이 최선이다”고 설명했다.   하지만, 선택할 수 있는 폭이 넓지 않기 때문에 많은 기업들이 기술적으로 숙달되고 통계 모델링을 ...

CIO A.T. Kearney A.T. 커니 분석 전문가 웨더컴퍼니 분석 예측 모델링 대학 통계 데이터 과학자 컨설팅 인재 빅데이터 산학연계

2015.12.11

A.T. 커니의 최근 조사에 따르면, 기업들은 통찰력을 얻기 위해 기업 데이터를 자유자재로 다룰 우수 데이터 과학자 채용에 어려움을 겪는 것으로 나타났다.  이미지 출처 : Thinkstock 빅데이터를 분석할 수 있는 숙련된 인력 부족 이외에 불필요한 정보를 제거해야 하다는 문제가 더해지면서 CIO들이 지속적으로 어려움을 겪고 있다. 430명의 고위 임원을 대상으로 한 A.T. 커니의 새로운 조사에 따르면, 가장 발전된 분석 역량을 갖춘 기업조차도 데이터에서 통찰력을 만들어 낼 수 있는 인력을 충분히 고용하지 못한 기업들이 2/3에 이르는 것으로 파악됐다. 또 기업들은 향후 5년 동안 33%나 많은 빅데이터 인재를 필요로 하게 될 것이라고 A.T. 커니의 파트너 겸 해당 연구 보고서의 공동 저자 칼리드 칸(왼쪽 사진)은 말했다. 데이터 분석 전문 인재를 채용해 이들이 회사에 남아 있도록 하는 것은 쉽지 않다. 기업들이 사업을 디지털화하면서 제품을 다듬거나 프로세스 효율성을 높이거나 새로운 수익원을 찾는데 도움이 되는 상관관계에 관한 결과 데이터 수집이 필수적이다. 예를 들어, 웨더컴퍼니(Weather Company)는 소매 기업들이 물 재고량 증감을 예측할 수 있도록 날씨 패턴을 예측하는 방법을 고민하고 있다. 문제는 빅데이터의 비즈니스 사례는 무한한 것처럼 보이지만 인재풀은 여전히 작다는 데 있다.  데이터 분석 인재에 대한 3가지 위협 조사에서 칸은 기업들이 통계, 디지털 기술, 비즈니스 전략 이 3가지를 모두 제대로 이해하고 있는 사람들을 필요로 한다고 말했다. “이 3가지 자격을 갖춘 전문가는 의사결정 과정에 데이터 분석을 통합시켜 비즈니스 전략을 수립하고 경쟁우위를 이끌어 내는 전문가들이다. 이들을 확보하는 것이 최선이다”고 설명했다.   하지만, 선택할 수 있는 폭이 넓지 않기 때문에 많은 기업들이 기술적으로 숙달되고 통계 모델링을 ...

2015.12.11

블로그 | B2B 콘텐츠 마케팅의 ROI 측정 지표

콘텐츠 마케팅은 기업 규모에 상관없이 전세계 마케팅부서에서 핵심 축이 됐다. 하지만 이 콘텐츠 마케팅에 들어가는 시간, 비용, 에너지 대비 효과를 어떻게 측정하고, 궁극적으로는 그 효과를 입증하느냐가 관건이다. 2015 B2B 마케팅 전망 보고서에 따르면, 호주 B2B 마케터의 46%는 ROI 측정이 가장 큰 마케팅 과제로 지목했다. 이는 ADMA의 후원으로 그린햇이 조사해 작성한 2015 연간 보고서 내용의 일부며, 이 조사에는 호주의 B2B 마케터 455명이 참여했다. 이들 마케터들은 ROI 측정의 중요성과 콘텐츠 마케터들이 직면한 어려움을 강조했다. 하지만 기본적인 통계를 분석하는 것은 퍼즐의 일부일 뿐이다. 콘텐츠 마케팅 ROI를 제대로 측정하려면 먼저 콘텐츠 전략을 수립하고 난 다음에 구매자의 여정을 위해 만들어진 SMART 목표를 측정해야 한다. 구매자가 상품을 구매하기까지의 여정은 다음의 3단계로 나뉜다. • 인지 단계 • 고민 단계 • 결정 단계 그렇다면, 콘텐츠 마케팅 활동의 효과를 측정하는데 어떤 지표를 사용해야 할까? • 공유와 참여 • 소비 • 리드 제너레이션과 판매 대부분의 콘텐츠 및 소셜 미디어 마케터들은 자신들의 성공을 측정하기 위해 숫자에 의존하고 있다. 이 숫자가 말해주는 것은 사람들이 페이스북, 링크드인, 트위터 같은 채널에서 콘텐츠를 몇 번이나 공유하느냐다. 하지만 이 좋아요 수, 링크드인 공유 건수, 트윗 수들은 실제로 얼마나 참여하는지에 대한 자세한 정보나 통찰력을 보여주지 않는다. 다행히도, 참여 수준을 분석하고 소셜 미디어 채널에서 콘텐츠 마케팅이 얼마나 나 되는지에 대한 통찰력을 얻게 해주는 툴들이 있다. 다음은 이러한 툴 가운데 일부다. • 버퍼(Buffer) • 클라우트(Klout) • 훗스위트(HootSuite) • 스프라우트소셜(SproutSocial) 좋아...

CRM 잠재 고객 리드 제너레이션 콘텐츠 마케팅 마케터 효과 B2B CMO 통계 소셜미디어 ROI 측정 지표

2015.11.23

콘텐츠 마케팅은 기업 규모에 상관없이 전세계 마케팅부서에서 핵심 축이 됐다. 하지만 이 콘텐츠 마케팅에 들어가는 시간, 비용, 에너지 대비 효과를 어떻게 측정하고, 궁극적으로는 그 효과를 입증하느냐가 관건이다. 2015 B2B 마케팅 전망 보고서에 따르면, 호주 B2B 마케터의 46%는 ROI 측정이 가장 큰 마케팅 과제로 지목했다. 이는 ADMA의 후원으로 그린햇이 조사해 작성한 2015 연간 보고서 내용의 일부며, 이 조사에는 호주의 B2B 마케터 455명이 참여했다. 이들 마케터들은 ROI 측정의 중요성과 콘텐츠 마케터들이 직면한 어려움을 강조했다. 하지만 기본적인 통계를 분석하는 것은 퍼즐의 일부일 뿐이다. 콘텐츠 마케팅 ROI를 제대로 측정하려면 먼저 콘텐츠 전략을 수립하고 난 다음에 구매자의 여정을 위해 만들어진 SMART 목표를 측정해야 한다. 구매자가 상품을 구매하기까지의 여정은 다음의 3단계로 나뉜다. • 인지 단계 • 고민 단계 • 결정 단계 그렇다면, 콘텐츠 마케팅 활동의 효과를 측정하는데 어떤 지표를 사용해야 할까? • 공유와 참여 • 소비 • 리드 제너레이션과 판매 대부분의 콘텐츠 및 소셜 미디어 마케터들은 자신들의 성공을 측정하기 위해 숫자에 의존하고 있다. 이 숫자가 말해주는 것은 사람들이 페이스북, 링크드인, 트위터 같은 채널에서 콘텐츠를 몇 번이나 공유하느냐다. 하지만 이 좋아요 수, 링크드인 공유 건수, 트윗 수들은 실제로 얼마나 참여하는지에 대한 자세한 정보나 통찰력을 보여주지 않는다. 다행히도, 참여 수준을 분석하고 소셜 미디어 채널에서 콘텐츠 마케팅이 얼마나 나 되는지에 대한 통찰력을 얻게 해주는 툴들이 있다. 다음은 이러한 툴 가운데 일부다. • 버퍼(Buffer) • 클라우트(Klout) • 훗스위트(HootSuite) • 스프라우트소셜(SproutSocial) 좋아...

2015.11.23

관리 복잡해도 대세는 '멀티벤더 아웃소싱'

대기업들이 IT아웃소싱에 계약 기간은 짧고, 가격은 저렴한 계약 조건을 요구하고 있다. 실제로 이들 기업들의 뜻대로 되고 있으나 이에 따른 문제도 발생하고 있다. 이미지 출처: Thinkstock 아웃소싱 컨설팅업체 ISG(Information Services Group)의 북유럽·아시아 부문 사장이자 CMO인 존 케플은 “쉽게 설명하자면 전반적으로 아웃소싱 계약은 상업적·법적인 측면에서 그 어느 때보다 유연해지고 있다. 이로 인해 아웃소싱 고객인 IT조직들은 막대한 영향력을 행사하고 있으며, 아웃소싱업체에 혁신과 효율, 수용적인 태도를 요구하고 있다”고 말했다. ISG 아웃소싱 인덱스에 따르면 올 3분기에 체결된 전세계 IT아웃소싱 계약 건수는 전년 동기 대비 19% 증가했다. 3분기 계약 규모는 전년 동기와 같은 56억 달러(약 6조 3,313억 6,000만원)인 것으로 집계됐다. 올 1·2·3분기에 체결된 계약 건수는 사상 최고치인 1,094건을 기록했으나, 계약 규모는 전년 대비 11%나 하락했다. 기업들은 특정 서비스에 특화된 소규모 아웃소싱업체를 선호하고 있다. 또 IT 발전, 인건비 변화, 아웃소싱 모델의 진화 등 업계 변화에 기민하게 대응하고자 장기 계약과 대형 계약을 거부하고 있다. ISG에 따르면 올 3분기에 체결된 대형 계약(연 1억 달러 이상)은 5건에 불과했다. 올 1·2·3분기 안에 체결된 대형 계약은 14건으로, 지난 10년간의 수치 중 최저치다. 이 같은 대형 계약은 완전히 사라지지는 않겠지만 감소세에 접어들 것으로 예상된다. 케플은 “대기업이 대규모 사업을 추진하는 이상 큰 계약은 계속 이뤄질 것이나 계약 체결 건수는 줄어들 것”이라고 언급했다. 또 큰 계약이 이뤄지더라도 미국이 아닌 신흥 시장에서 주로 체결될 것으로 예상된다. --------------------...

아웃소싱 조사 통계 멀티벤더 아웃소싱 IT 아웃소싱 ISG 멀티소싱 2015년 3분기 IT 아웃소싱

2015.10.27

대기업들이 IT아웃소싱에 계약 기간은 짧고, 가격은 저렴한 계약 조건을 요구하고 있다. 실제로 이들 기업들의 뜻대로 되고 있으나 이에 따른 문제도 발생하고 있다. 이미지 출처: Thinkstock 아웃소싱 컨설팅업체 ISG(Information Services Group)의 북유럽·아시아 부문 사장이자 CMO인 존 케플은 “쉽게 설명하자면 전반적으로 아웃소싱 계약은 상업적·법적인 측면에서 그 어느 때보다 유연해지고 있다. 이로 인해 아웃소싱 고객인 IT조직들은 막대한 영향력을 행사하고 있으며, 아웃소싱업체에 혁신과 효율, 수용적인 태도를 요구하고 있다”고 말했다. ISG 아웃소싱 인덱스에 따르면 올 3분기에 체결된 전세계 IT아웃소싱 계약 건수는 전년 동기 대비 19% 증가했다. 3분기 계약 규모는 전년 동기와 같은 56억 달러(약 6조 3,313억 6,000만원)인 것으로 집계됐다. 올 1·2·3분기에 체결된 계약 건수는 사상 최고치인 1,094건을 기록했으나, 계약 규모는 전년 대비 11%나 하락했다. 기업들은 특정 서비스에 특화된 소규모 아웃소싱업체를 선호하고 있다. 또 IT 발전, 인건비 변화, 아웃소싱 모델의 진화 등 업계 변화에 기민하게 대응하고자 장기 계약과 대형 계약을 거부하고 있다. ISG에 따르면 올 3분기에 체결된 대형 계약(연 1억 달러 이상)은 5건에 불과했다. 올 1·2·3분기 안에 체결된 대형 계약은 14건으로, 지난 10년간의 수치 중 최저치다. 이 같은 대형 계약은 완전히 사라지지는 않겠지만 감소세에 접어들 것으로 예상된다. 케플은 “대기업이 대규모 사업을 추진하는 이상 큰 계약은 계속 이뤄질 것이나 계약 체결 건수는 줄어들 것”이라고 언급했다. 또 큰 계약이 이뤄지더라도 미국이 아닌 신흥 시장에서 주로 체결될 것으로 예상된다. --------------------...

2015.10.27

분석으로 본 야구와 비즈니스 '닮은 점 vs. 다른 점'

뉴욕증권거래소에서 열린 넷스위트 NYSE 디스럽션 서밋(NetSuite NYSE Disruption Summit)에서 빌 제임스와 빌리 빈이 데이터, 진실, 그리고 세이버매트릭스의 전망에 대해 의견을 나눴다. 이미지 출처 : Thinkstock 야구를 통계학적·수학적으로 분석하는 방법론인 세이버메트릭스(sabermetrics)의 창시자 빌 제임스는 세이버메트릭스에 관해 한가지 오해가 퍼져있다고 이야기했다. 많은 이들이 세이버메트릭스의 핵심을 데이터라 생각하지만, 이것의 본질은 어디까지나 야구에 관한 경험적 분석 방법론이다. 그리고 여기에서 데이터가 수행하는 역할은, 잘못 퍼진 오해들을 정리해내 진짜 사실들만을 남겨두는 것이다. 제임스는 “야구 경기와 선수들에 관한 시각을 구축하는 것이 어려운 이유는 산업 전반에 걸쳐 데이터에 관한 말도 안되는 생각들이 만연해 있었기 때문이다”라고 말했다. 제임스는 지금 타석에 올라온 타자가 왼손잡이 투수에 대한 타율을 설명하는 경기 캐스터의 말은 새겨 들을 필요가 없는 것이라 이야기했다. 그는 “캐스터들이 ‘기록’이라는 이름으로 경기 내내 떠드는 말들은 아무 의미 없는 것들이다”라고 덧붙였다. 오클랜드 애슬레틱스(Oakland Athletics) 총괄 매니저(GM) 겸 유소년팀 구단주인 빌리 빈도 이런 제임스의 의견에 동의했다. 빈은 “너무 많은 사람들이 경기와 기록에 관해 목소리를 낸다. 그런데 그것들을 들어보면 신기하게도 모든 이들의 의견이 서로 다르다. 물론 스포츠는 우리를 흥분시키고 그렇다 보면 의견에 감정이 섞이는 게 불가피하다. 이런 이유로 개인적으론 우리 팀의 경기를 절대 관람하지 않는다”고 말했다. 경기를 관람하는 대신 빈은 경기 종료 후 데이터를 분석하는데 집중한다. 빈은 이런 방식이 매니저로서 좀더 합리적인 결정을 내리는데 도움을 준다고 이야기했다. ---...

CIO 빅데이터 통계 야구 머니볼 스포츠 분석 기록 세이버메트릭스

2015.09.24

뉴욕증권거래소에서 열린 넷스위트 NYSE 디스럽션 서밋(NetSuite NYSE Disruption Summit)에서 빌 제임스와 빌리 빈이 데이터, 진실, 그리고 세이버매트릭스의 전망에 대해 의견을 나눴다. 이미지 출처 : Thinkstock 야구를 통계학적·수학적으로 분석하는 방법론인 세이버메트릭스(sabermetrics)의 창시자 빌 제임스는 세이버메트릭스에 관해 한가지 오해가 퍼져있다고 이야기했다. 많은 이들이 세이버메트릭스의 핵심을 데이터라 생각하지만, 이것의 본질은 어디까지나 야구에 관한 경험적 분석 방법론이다. 그리고 여기에서 데이터가 수행하는 역할은, 잘못 퍼진 오해들을 정리해내 진짜 사실들만을 남겨두는 것이다. 제임스는 “야구 경기와 선수들에 관한 시각을 구축하는 것이 어려운 이유는 산업 전반에 걸쳐 데이터에 관한 말도 안되는 생각들이 만연해 있었기 때문이다”라고 말했다. 제임스는 지금 타석에 올라온 타자가 왼손잡이 투수에 대한 타율을 설명하는 경기 캐스터의 말은 새겨 들을 필요가 없는 것이라 이야기했다. 그는 “캐스터들이 ‘기록’이라는 이름으로 경기 내내 떠드는 말들은 아무 의미 없는 것들이다”라고 덧붙였다. 오클랜드 애슬레틱스(Oakland Athletics) 총괄 매니저(GM) 겸 유소년팀 구단주인 빌리 빈도 이런 제임스의 의견에 동의했다. 빈은 “너무 많은 사람들이 경기와 기록에 관해 목소리를 낸다. 그런데 그것들을 들어보면 신기하게도 모든 이들의 의견이 서로 다르다. 물론 스포츠는 우리를 흥분시키고 그렇다 보면 의견에 감정이 섞이는 게 불가피하다. 이런 이유로 개인적으론 우리 팀의 경기를 절대 관람하지 않는다”고 말했다. 경기를 관람하는 대신 빈은 경기 종료 후 데이터를 분석하는데 집중한다. 빈은 이런 방식이 매니저로서 좀더 합리적인 결정을 내리는데 도움을 준다고 이야기했다. ---...

2015.09.24

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.9