2016.01.27

당신의 데이터 과학자 채용·활용 방법은 틀렸다

Sarah K. White | CIO
지난 2012년 하버드 비즈니스 리뷰는 데이터 과학자를 '21세기 가장 섹시한 직업'으로 명명했다. 데이터 과학자는 글래스도어의 '미국 최고의 직업 25선'에서도 1위에 올랐다. 그런데 그렇게 채용된 데이터 과학자는 해야 할 일을 제대로 하고 있을까?


이미지 출처 : Thinkstock

데이터 과학자의 역할 중 하나는 회사가 고객 또는 내부 연구를 통해 최대한 많은 양의 정보를 수집할 수 있도록 돕는 것이다. 그동안 헬스케어, IT, 보험, 금융, 교육 등 거의 모든 업종의 기업이 데이터를 다뤘지만 한계가 있었다. 결국 데이터를 수집하는 것뿐 아니라 안전하게 보관하고 직원이 관련 데이터에 접근할 수 있도록 전문가에게 맡겨야 한다는 것을 깨달았다.

능력의 부족이 아니라 환경의 문제
빅데이터 소프트웨어 업체인 ZL 테크놀로지스의 공동 창립자이자 회장, CEO인 콩 렁은 “이상적인 환경이라면 데이터 과학자의 임무는 특별한 문제없이 모든 비즈니스 콘텐츠를 신속하고 유연하게 접근·관리해 조직 안에서 발생하는 비즈니스와 IT 문제의 핵심을 찾아내 해결하는 것”이라고 말했다.

그러나 많은 기업이 각기 다른 데이터 소스에서 전달 받아 어지럽게 뒤얽힌 데이터의 늪에 빠져 있다. 이 때문에 데이터 과학자 대부분이 실제로 데이터를 분석하지 못하고, 정리되지 않은 채 쌓여만 있는 데이터를 헤쳐 나가기에 급급한 상황이다.

데이터 과학자가 새로운 회사에 입사했을 때 조직화하지 않고 한데 모이지 않은 데이터에 맞닥뜨리게 된다. 그리고 이 데이터에 대해 데이터 과학자가 잘 알 것으로 생각하는 회사의 기대에서 문제가 시작된다. 이 때문에 데이터 과학자는 데이터를 분석해 사업에 도움이 될 만한 사용법을 연구하는 대신, 단순히 데이터를 분석하는 일에 업무 시간 대부분을 쓴다. 렁은 "데이터 과학자의 핵심 업무는 다른 직원으로부터 데이터를 찾아달라는 요청을 받아 처리하는 것이 아니"라며 "데이터 과학자가 이런 식의 요청을 해결하는 일에서 벗어날 필요가 있다"고 말했다.

렁은 “현재의 상황은 데이터 과학자가 중앙으로 모인 데이터에 간편하게 접근하는 대신, 다수의 플랫폼과 각 부서에 흩어져 있는 여러 IT 시스템에서 데이터를 수집해야 하는 형국”이라고 말했다. 데이터가 중복되거나 서로 연결되지 않거나 잘못된 위치에 수집되는 일도 자주 발생한다. 새로 입사한 데이터 과학자가 데이터 접근 시 편리하게 사용할 만한 단일 플랫폼이 없는 상황이다.

이 때문에 데이터 과학자가 데이터 분석 결과를 내는 데 상당한 부담이 발생한다. 렁은 “간단해 보이는 요청도 데이터 과학자가 처리하는 데 시간이 오래 걸리는 이유는 능력의 부족이 아니라 데이터 환경 때문”이라고 말했다.


구직 중인 데이터 과학자가 유념해야 할 것
이런 일을 피하려면 데이터 과학자는 희망하는 업체가 사용 중인 플랫폼과 기술에 대해 전부 확인해야 한다. 처음 면접을 볼 때 회사의 데이터 상태를 확실하게 이해했음을 알리기 위해서라도 질문을 해야 한다. 또한 입사 후에는 이미 조직화된 데이터를 빠르고 편리하게 분석하는 일을 할 뿐, 데이터를 조직하는 일은 하지 않을 것을 분명히 밝혀야 한다. 만일 데이터가 조직화되지 않은 경우라면, 이를 해결할 방법이나 적절한 툴과 소프트웨어를 구매할 예산이 있는지 확인해야 한다.

렁은 “회사의 의사결정에 도움이 되려면 데이터 과학자가 신속하고 편리하게 데이터를 분석할 수 있어야 한다"며 "그러나 현재의 환경은 데이터가 여기저기 흩어져 있을수록 더 어렵다”고 말했다. 데이터 과학자라면 군데군데 방대하게 분산된 데이터를 찾아내야 하는, 그런 일을 맡고 싶지는 않을 것이다.

렁은 데이터 과학자로 고용된 줄 알았는데 데이터 관리인처럼 일하게 된 상황이라면 당당하게 의견을 밝히라고 조언했다. 회사 운영과 관련해 데이터의 근본적인 중요성을 강조하고, 데이터가 분산되고 조직화되지 않으면 얼마나 쓸모가 없는지 알려야 한다는 것이다. “정리되지 않은 데이터는 IT나 데이터 과학의 문제가 아니며 기업의 문제"라며 "데이터 과학자는 경영진에게 이런 문제를 전달할 힘이 있는 특별한 위치에 있다”고 그는 덧붙였다.

데이터 과학자를 채용하는 방법
반대로 데이터 과학자 채용을 고려 중인 고용주라면, 한 걸음 물러서서 채용하려는 직무의 실상과 데이터 과학자의 중요성을 인지해야 한다. 즉 데이터 과학자가 사업에 필요한 데이터를 분석할 뿐만 아니라 관련 문제를 찾아내고 해결하는 사람임을 깨달아야 한다.

단, 데이터 과학자가 문제를 어느 정도 해결할 것이라고 기대할 수는 있지만, 전적으로 맡기거나 마술처럼 해결해 주기를 바라면 안 된다. 렁의 표현대로 “데이터 과학자는 마법사가 아니”라는 것이다. 데이터 과학자의 업무가 성과를 내려면 회사의 지원이 가장 중요하다. 특히 올해 들어 데이터는 전보다 더 중요해지고 있으며, 데이터 체계를 뒤늦게 정비하는 기업은 후회할 수도 있는 상황이다.

시스템이 여기저기 분산되고 겹칠수록 대량 분석 시 데이터의 가치가 그 만큼 훼손된다. 렁은 “비즈니스 리더와 기술팀 사이에 존재하는 문화적 차이 때문에 소통이 이뤄지지 않는다"며 "그런데도 데이터 분석과 관리 문제를 논의하기 위해 공통의 용어를 정립한 기업은 거의 없다"고 지적했다.

마지막으로 렁은 "데이터가 기업의 생명줄임을 아는 것이 중요하며, 정보를 순환시키는 과정이 부드럽고 효율적으로 흘러갈 필요가 있다"고 조언했다. 그는 "이에 따른 효과는 IT를 넘어서 법적인 영역, 컴플라이언스, BI, 리스크 관리, 생산성까지 미친다. 기업이 일상적인 사업에서 빅데이터의 중요성을 빨리 이해하고 인지할수록 데이터 과학자가 그 만큼 빨리 역량을 최대한 발휘할 수 있다"고 말했다. ciokr@idg.co.kr 



2016.01.27

당신의 데이터 과학자 채용·활용 방법은 틀렸다

Sarah K. White | CIO
지난 2012년 하버드 비즈니스 리뷰는 데이터 과학자를 '21세기 가장 섹시한 직업'으로 명명했다. 데이터 과학자는 글래스도어의 '미국 최고의 직업 25선'에서도 1위에 올랐다. 그런데 그렇게 채용된 데이터 과학자는 해야 할 일을 제대로 하고 있을까?


이미지 출처 : Thinkstock

데이터 과학자의 역할 중 하나는 회사가 고객 또는 내부 연구를 통해 최대한 많은 양의 정보를 수집할 수 있도록 돕는 것이다. 그동안 헬스케어, IT, 보험, 금융, 교육 등 거의 모든 업종의 기업이 데이터를 다뤘지만 한계가 있었다. 결국 데이터를 수집하는 것뿐 아니라 안전하게 보관하고 직원이 관련 데이터에 접근할 수 있도록 전문가에게 맡겨야 한다는 것을 깨달았다.

능력의 부족이 아니라 환경의 문제
빅데이터 소프트웨어 업체인 ZL 테크놀로지스의 공동 창립자이자 회장, CEO인 콩 렁은 “이상적인 환경이라면 데이터 과학자의 임무는 특별한 문제없이 모든 비즈니스 콘텐츠를 신속하고 유연하게 접근·관리해 조직 안에서 발생하는 비즈니스와 IT 문제의 핵심을 찾아내 해결하는 것”이라고 말했다.

그러나 많은 기업이 각기 다른 데이터 소스에서 전달 받아 어지럽게 뒤얽힌 데이터의 늪에 빠져 있다. 이 때문에 데이터 과학자 대부분이 실제로 데이터를 분석하지 못하고, 정리되지 않은 채 쌓여만 있는 데이터를 헤쳐 나가기에 급급한 상황이다.

데이터 과학자가 새로운 회사에 입사했을 때 조직화하지 않고 한데 모이지 않은 데이터에 맞닥뜨리게 된다. 그리고 이 데이터에 대해 데이터 과학자가 잘 알 것으로 생각하는 회사의 기대에서 문제가 시작된다. 이 때문에 데이터 과학자는 데이터를 분석해 사업에 도움이 될 만한 사용법을 연구하는 대신, 단순히 데이터를 분석하는 일에 업무 시간 대부분을 쓴다. 렁은 "데이터 과학자의 핵심 업무는 다른 직원으로부터 데이터를 찾아달라는 요청을 받아 처리하는 것이 아니"라며 "데이터 과학자가 이런 식의 요청을 해결하는 일에서 벗어날 필요가 있다"고 말했다.

렁은 “현재의 상황은 데이터 과학자가 중앙으로 모인 데이터에 간편하게 접근하는 대신, 다수의 플랫폼과 각 부서에 흩어져 있는 여러 IT 시스템에서 데이터를 수집해야 하는 형국”이라고 말했다. 데이터가 중복되거나 서로 연결되지 않거나 잘못된 위치에 수집되는 일도 자주 발생한다. 새로 입사한 데이터 과학자가 데이터 접근 시 편리하게 사용할 만한 단일 플랫폼이 없는 상황이다.

이 때문에 데이터 과학자가 데이터 분석 결과를 내는 데 상당한 부담이 발생한다. 렁은 “간단해 보이는 요청도 데이터 과학자가 처리하는 데 시간이 오래 걸리는 이유는 능력의 부족이 아니라 데이터 환경 때문”이라고 말했다.


구직 중인 데이터 과학자가 유념해야 할 것
이런 일을 피하려면 데이터 과학자는 희망하는 업체가 사용 중인 플랫폼과 기술에 대해 전부 확인해야 한다. 처음 면접을 볼 때 회사의 데이터 상태를 확실하게 이해했음을 알리기 위해서라도 질문을 해야 한다. 또한 입사 후에는 이미 조직화된 데이터를 빠르고 편리하게 분석하는 일을 할 뿐, 데이터를 조직하는 일은 하지 않을 것을 분명히 밝혀야 한다. 만일 데이터가 조직화되지 않은 경우라면, 이를 해결할 방법이나 적절한 툴과 소프트웨어를 구매할 예산이 있는지 확인해야 한다.

렁은 “회사의 의사결정에 도움이 되려면 데이터 과학자가 신속하고 편리하게 데이터를 분석할 수 있어야 한다"며 "그러나 현재의 환경은 데이터가 여기저기 흩어져 있을수록 더 어렵다”고 말했다. 데이터 과학자라면 군데군데 방대하게 분산된 데이터를 찾아내야 하는, 그런 일을 맡고 싶지는 않을 것이다.

렁은 데이터 과학자로 고용된 줄 알았는데 데이터 관리인처럼 일하게 된 상황이라면 당당하게 의견을 밝히라고 조언했다. 회사 운영과 관련해 데이터의 근본적인 중요성을 강조하고, 데이터가 분산되고 조직화되지 않으면 얼마나 쓸모가 없는지 알려야 한다는 것이다. “정리되지 않은 데이터는 IT나 데이터 과학의 문제가 아니며 기업의 문제"라며 "데이터 과학자는 경영진에게 이런 문제를 전달할 힘이 있는 특별한 위치에 있다”고 그는 덧붙였다.

데이터 과학자를 채용하는 방법
반대로 데이터 과학자 채용을 고려 중인 고용주라면, 한 걸음 물러서서 채용하려는 직무의 실상과 데이터 과학자의 중요성을 인지해야 한다. 즉 데이터 과학자가 사업에 필요한 데이터를 분석할 뿐만 아니라 관련 문제를 찾아내고 해결하는 사람임을 깨달아야 한다.

단, 데이터 과학자가 문제를 어느 정도 해결할 것이라고 기대할 수는 있지만, 전적으로 맡기거나 마술처럼 해결해 주기를 바라면 안 된다. 렁의 표현대로 “데이터 과학자는 마법사가 아니”라는 것이다. 데이터 과학자의 업무가 성과를 내려면 회사의 지원이 가장 중요하다. 특히 올해 들어 데이터는 전보다 더 중요해지고 있으며, 데이터 체계를 뒤늦게 정비하는 기업은 후회할 수도 있는 상황이다.

시스템이 여기저기 분산되고 겹칠수록 대량 분석 시 데이터의 가치가 그 만큼 훼손된다. 렁은 “비즈니스 리더와 기술팀 사이에 존재하는 문화적 차이 때문에 소통이 이뤄지지 않는다"며 "그런데도 데이터 분석과 관리 문제를 논의하기 위해 공통의 용어를 정립한 기업은 거의 없다"고 지적했다.

마지막으로 렁은 "데이터가 기업의 생명줄임을 아는 것이 중요하며, 정보를 순환시키는 과정이 부드럽고 효율적으로 흘러갈 필요가 있다"고 조언했다. 그는 "이에 따른 효과는 IT를 넘어서 법적인 영역, 컴플라이언스, BI, 리스크 관리, 생산성까지 미친다. 기업이 일상적인 사업에서 빅데이터의 중요성을 빨리 이해하고 인지할수록 데이터 과학자가 그 만큼 빨리 역량을 최대한 발휘할 수 있다"고 말했다. ciokr@idg.co.kr 

X