Offcanvas

CIO / 경력관리 / 비즈니스|경제 / 빅데이터 | 애널리틱스 / 신기술|미래 / 애플리케이션 / 자기계발

현직 7인이 말하는 '데이터 과학자의 길'

2017.12.29 Christina Tynan-Wood  |  CIO
우리 대부분이 대학생일 때만 해도 데이터 과학자라는 역할이 존재하지 않았다. 과학적 데이터 분석 방법과 통계적 데이터 분석 방법을 합치고 방대한 데이터 은행에서 패턴과 해답을 추출하는 도구의 사용 방법에 대한 지식을 결합하는 것이다. 재미없는 작업 같은가? 사실 그렇지 않다. 지난 2012년 하버드 비즈니스 리뷰(Harvard Business Review)에서 “21세기 최고의 섹시한 직업”이라고 명명했을 정도다.



실제로 거의 모든 기업이 데이터 과학자를 원한다. 특히 더 중요한 것은 이제 정보 시대에 깊숙이 진입하면서 기업이라면 최종 제품이나 고객의 종류와 관계 없이 데이터 과학자가 필요해 졌다는 사실이다. IBM에 따르면, 전 세계 데이터의 대부분은 지난 2년 동안 생성됐다. 데이터 생성 속도는 그 어느 때보다 빠르다. 인류는 매일 250경 바이트의 데이터를 만든다. 이 데이터를 분류하고 조사할 방법이 없다면 인간은 데이터를 활용해 더 현명한 의사결정을 내리는 것은 고사하고 데이터에 파묻히기에 십상일 것이다.

데이터 과학자(또는 데이터 과학자 팀)는 이 데이터를 이해해 기업이 고객의 필요와 불만에 대응하도록 도움을 준다. 동시에 기업은 데이터 과학자의 도움을 받아 비용과 제조 과정을 통제할 수 있다. 유례 없이 폭주하는 데이터 속에서 추출할 수 있는 것이라면 무엇이나, 예를 들면 트렌드가 어떻게 수익에 영향을 미치는가 등을 이해할 수 있다.

문제는 데이터 과학자(그 말이 세간에서 들린다면)가 유니콘만큼이나 희귀하다는 점이다. 그래도 몇 명 찾아내기는 했다. 이들을 심층 인터뷰해 몇가지를 확인했다. 데이터 과학에는 물리학은 물론 심지어 천체물리학까지 활용된다는 것과 작업이 지저분하다는 것, 심지어 신발 업체조차 방대한 양의 데이터를 갖고 있다는 것, 엄청난 양의 데이터를 활용해 중대한 질문을 한다고 해도 누군가는 여전히 무엇을 해야 할지 결정을 내려야 한다는 것 등이다. 이제 이 섹시한 유니콘들의 이야기를 자세히 들어보자.



메기 폰 하트만, 이파이낸셜의 데이터 과학자
메기 폰 하트만은 데이터 과학자라는 직책이 존재하기 전부터 데이터 과학자로 일해 왔다. 산업공학 박사학위 소지자이며 최적화와 연산 연구를 전문으로 한다. 그는 실리콘 밸리(Silicon Valley)의 한 신생기업에서 격무에 시달리다가 이파이낸셜(Efinancial)로 이직했다. 기업의 마케팅 목표 달성에 도움이 될 데이터 모델을 구축하는 일을 하고 있다. 하트만은 자신의 직책에 대해 “어느 시점에서는 개명과 이미지 쇄신이 필요했다”고 말했다.

데이터 과학자가 아닌 사람들이 잘 모르는 것이 무엇이냐는 질문에 “데이터 과학은 지저분하다”는 것이라고 말했다. 하트만은 대부분의 시간을 '청소'에 할애한다. 그는 “20%의 시간을 실제 데이터 모델링 및 과학에 쓰고 나머지 80%를 데이터 청소와 습득에 쓴다”고 말했다. 데이터 작업 이외의 시간에는 개인적인 연구를 즐긴다. 그는 “행복한 아이로 키워낼 수 있는 최고의 양육법을 찾아내기 위해 현재 연구 중이다”라고 말했다.



앤서니 로즈, 우버의 데이터 과학자 팀 관리자
앤서니 로즈의 입장에서는 입자 물리학의 데이터 작업이나 공항에서 우버(Uber) 택시를 잡기 위해 필요한 데이터 작업이나 큰 차이가 없다. 그는 우버에서 데이터 과학자 팀의 관리 업무를 맡고 있다. 우버의 데이터 과학자 팀은 공항이나 대형 행사장, 교외 등 택시를 잡기 어려운 장소에서 택시 잡기를 쉽게 만드는 방법을 찾고 있다.

공학팀 및 제품팀과 긴밀히 공조하고 통계 분석에서부터 데이터 가시화, 실험, 머신러닝, 모델링에 이르기까지 모든 것을 처리한다. 그는 “우리는 방대한 양의 데이터를 보유하고 있다. 시간만 충분하다면 흥미로운 질문을 엄청나게 많이 할 수 있다”라고 말했다.

이는 그가 입자 물리학 박사과정에서 하던 작업과 별반 다르지 않다. 그는 CERN의 대형 강입자 충돌기(LHC)에서 박사 후 연구를 했다. 힉스(Higgs)와 새로운 물리학을 찾기도 했고 그 밖에 다량의 데이터와 복잡한 답변이 연루된 엄청난 질문과 씨름하기도 했다. 로즈는 “그런 종류의 일은 업계에서 해 오던 일과 잘 맞는다. 신호가 꼭꼭 숨어 있는 대형 데이터 모음, 실험적인 설계, 많은 통계 작업과 코딩 등이 공통점이다”라고 말했다.



대니엘 딘, 마이크로소프트 데이터 과학자
대니엘 딘이 데이터 과학을 하게 된 계기는 심리학이었다. 그는 “계량 심리학 박사 과정을 밟았다. 수학과 통계를 활용해 개별 행동을 대규모로 연구할 수 있다는 점에 매료되었기 때문이다”라고 말했다. 지금 데이터 과학이라고 부르는 것과 크게 다르지 않다. 아닌 게 아니라 딘은 이를 통해 데이터 측정, 분석, 가시화에 대해 고민하는 법, 이를 가능하게 하는 기술(프로그래밍 언어와 도구)을 사용하는 법을 배웠다

딘은 현재 마이크로소프트(Microsoft) 인공지능 및 연구 그룹을 이끌고 있다. 그의 팀은 물리학, 해양학, 컴퓨터 과학, 통계학, 신경 과학 등 다양한 분야를 대표하는 데이터 과학자와 공학자로 구성됐으며, 예측 분석 및 머신러닝 솔루션을 구축하는 일을 하고 있다. 그는 "고객과 함께 맞춤형 분석 솔루션을 구축할 수 있고 제품 팀과 공조해 제품을 개선하고 계속해서 더 큰 문제를 해결해 나갈 수 있다. 내겐 즐겁게 일할 수 있는 역할이다”라고 말했다.



브래드 모르가트, 부즈 앨런의 데이터 과학자
부즈 앨런(Booz Allen)에서 브래드 모르가트가 속한 팀은 부동산 및 기반시설 포트폴리오를 분석해 고객이 펀딩 요건을 파악하고 의사 결정에 필요한 정보를 얻도록 도움을 주는 일이다. 그는 “기반시설과 부동산 자산은 유지 관리 비용이 매우 많이 든다. 우리 팀은 데이터 분석을 활용해 고객의 효율적인 자산 관리 활동을 지원한다”라고 말했다.

모르가트는 이런 종류의 데이터 분석을 오랫동안 해 오고 있다. 작년부터는 여러 개의 대형 데이터 모음을 활용해 의사 결정을 내리고자 하는 고객이 늘어났고, 빨리 결과를 원하는 경우도 많아졌다. 이에 따라 그와 그의 팀은 전통적인 도구인 마이크로소프트 엑셀(Excel), 액세스(Access)에서 벗어나 SQL, 파이선(Python), R 등을 활용하기 시작했다.

모르가트는 “새로운 기술 수요에 자극을 받았다. 부즈 앨런에서 데이터 과학자가 될 수 있는 추가 교육 기회가 왔을 때 놓치지 않았다”라고 말했다. 이 기업은 데이터 과학 팀을 길러내는 교육에 오랜 기간 투자해 왔다. 최근에는 분석가가 데이터 과학자로 전직할 수 있게 도와주는 기본 강좌를 내놓기도 했다.

모르가트의 업무에서 가장 큰 과제는 고객 요청을 그의 팀이 의미 있는 분석을 할 수 있게 해석하는 일이다. 그는 “고급 분석 도구를 이용해 대량 데이터를 신속하게 처리, 분석할 수 있다고 해도 고객의 미션과 목표를 파악하는 것은 여전히 필요하다. 분석은 우리가 하는 일의 큰 대부분이지만 결국에는 의사 결정을 위한 정보를 제공하는 도구일 뿐이다”라고 말했다.



리사 버튼, 하트랩 이사
리사 버튼은 미디어와 기술 분야에서 여성이 이끄는 초기 신생업체에서 일하고 있다. 그의 기계공학 박사학위 주제는 데이터 주도적 수학 모델링이었다. 자연스럽게 데이터 과학으로 연결됐다. 그는 “졸업할 때쯤 되자 데이터 과학이 뜨기 시작했다. 기업에서 데이터 과학자에게 원하는 것은 알고 보니 바로 내가 좋아하면서 하던 연구와 직결돼 있었다"라고 말했다.

그는 대학원을 졸업하자마자 오스틴(Austin)에 있는 애드테크(adtech) 신생기업 최초의 데이터 과학자가 됐다. 데이터를 이용해 유료 검색 광고 경매 입찰 과정을 최적화함으로써 자동화하고 개선했다. 그 다음에는 모바일 결제 신생업체로 이직했다가 신생기업을 대상으로 한 독자적인 데이터 과학 컨설팅 업체를 창업했다. 그곳에서 만난 고객과 의기 투합해 공동 설립한 것이 현재의 하트랩(HeartLab)이다. SNS 데이터를 이용해 브랜드의 고객 이해를 돕는 일을 하고 있다.

버튼은 이 모든 경험을 현직에 활용하고 있다. 그는 “우리는 가장 훌륭한 창업주와 기업을 만난다. 그러나 첫 번째 직장에서 배운 것 한 가지가 그 이후 모든 것에 영향을 끼쳤다. 데이터 과학을 다양한 사람에게 제대로 알려서 그들이 신나게 참여할 수 있게 하는 것이 매우 중요하다는 것이다. 이 교훈은 그 이후 내가 해 온 모든 일에 적용된다”라고 말했다.



니틴 마얀데, 나이키의 수석 데이터 과학자
니틴 마얀데는 네트워크와 그 작동 방식에 언제나 매료됐다. 그래서 전자공학과 무선통신 학사 학위를 받았지만 졸업 후에는 천체물리학을 공부하고자 했다. 대학원에 지원하는 동시에 인도에 있는 공업 기업에서 근무했다. 그는 “나는 언제나 최고의 기술 솔루션을 실행하고 싶어하는데 반해 경영진은 언제나 기술적으로는 뒤져도 시간이 적게 걸리는 솔루션을 선택한다는 것을 알게 됐다"라고 말했다.

이것은 마얀데가 의사결정 과학에 관심을 두게 된 계기였고 진로까지 바꾸게 됐다. 천체물리학 대신에 공업경영 박사과정을 밟은 것이다. 그는 “깊이 파면 팔수록 공학, 천체물리학, 경영학 등 그 종류와 관계없이 솔루션의 관건은 그 구조라는 점을 더 깨닫게 됐다. 그래서 결국 데이터 과학자가 됐다"라고 말했다.

현재 니틴은 나이키(Nike)의 중대한 제품 계획 관련 의사 결정에 도움을 줄 예측 내용을 만드는 일을 하고 있다. 그는 또한 데이터 과학자에 대한 오해를 바로잡고 싶어 한다. 그는 “사람들은 우리가 복잡한 알고리즘 구축에 모든 시간을 쓴다고 생각한다. 그러나 우리의 시간 중 대부분은 데이터를 정리해 사용 가능한 형식으로 만드는 데 사용된다. 일단 모든 것이 작동되면 분석은 금방 끝난다. 그러나 그 지점까지 도달하려면 많은 세부 작업과 문제 해결이 필요하다”라고 말했다.



예 자오, 스포티파이의 데이터 과학자
스포티파이(Spotify)의 새로운 셀프 서비스 광고 플랫폼 애드 스튜디오(Ad Studio) 작업을 하고 있는 데이터 과학자인 예 자오는 이 음악 기업의 제품 관련 의사 결정에 도움을 줄 혜안을 찾고 있다. 스트리밍 음악업체의 마케팅 업무나 마찬가지다. 그러나 예 자오는 원래 물리학자였다.

그는 늘 물리학에 관심이 있었고 학계에서 물리학 연구를 수행했으며 이를 증명이라도 하듯 그의 이름을 딴 소행성까지 있다. 그런 사람이 어쩌다가 스포티파이에 입사하게 됐을까? 그는 “데이터 과학은 물리학의 정확성과 기술적 부분을 인간 행동이라는 매력적인 주제에 응용한다는 느낌이 든다”라고 말했다.

예 자오는 소행성을 쫓는 물리학자에게서 기대할 수 있는 괴짜다움과 곰 인형을 사랑하는 창조자 정신을 모두 현재 업무에 활용하고 있다. 그는 “우리는 2000개의 LED로 이루어진 맞춤형 LED 배열에 물리적인 데이터 가시화를 만들어서 미국 내에서 스포티파이에서 이루어지는 데이터 스트리밍을 가시화 한 바 있다. 이는 하드웨어, 백엔드, 데이터 작업을 잘 결합한 것이다. 우리는 이것을 해킹 주간 중에 해냈다"라고 말했다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.