Offcanvas
2016.06.24 Sarah K. White  |  CIO


데이터 수집
데이터 수집은 정말 엄청난 일이다. 게다가 기업들은 실제 사용할 수 있거나 필요한 것보다 훨씬 많은 양의 데이터를 수집하는 경향이 있다. 무스타파는 데이터 수집을 도울 직원을 채용하기 전에 수집하고 싶은 데이터가 무엇인지 알아야 한다고 강조했다.

데이터 수집은 기업이 4가지 'V'에 직면했을 때 가장 큰 문제가 발생한다. 4가지 V란 'Volume(양)', 'Variety(다양성), 'Velocity(속도)', 'Veracity(정확성)'이다. 한 사람이 이 4가지를 모두 처리할 수 없기 때문이다. 예를 들어, 데이터의 양과 속도에 대한 전략을 파악하는 것은 데이터 과학자나 분석가가 아닌 데이터 엔지니어이다.

또 데이터 수집에 필요한 기술력을 판단하기 전에 청중과 고객 기반을 고려하는 것이 중요하다. 폴리치는 은행을 예로 들어 설명했다. 은행은 다운타임이나 데이터 검색 지연을 용납할 수 없다. 따라서 이런 특성에 부합하는 인재를 채용해야 한다. 이와 유사한 스트레스가 심한 환경에서 일한 경력이 있는 사람을 찾아야 한다는 의미다. 은행에서 다운타임이나 지연은 다른 산업보다 중요한 데이터 관련 속성이다.

반대로 소셜 미디어 네트워크는 데이터 검색에서 어느 정도의 지연이나 불일치는 수용할 수 있다. 특히 비용을 절약할 수 있다면 더욱 그렇다. 이는 애자일한 환경, 혁신적인 환경에서 일하는 것이 더 익숙한 사람이나 비즈니스에 중요한 다른 기술력을 가진 사람을 채용해야 한다는 의미다. 비즈니스의 데이터 활용 방법과 진짜 수집해야 할 데이터의 종류를 판단하는데 시간을 투자해야 한다. 그래야 적합한 인재 채용에 도움을 받을 수 있다.

츄수는 데이터 수집의 복잡성, 데이터를 더럽히고 문제를 초래할 수 있는 모든 것을 이해하는 사람을 찾는다고 말했다. 그는 "GIGO(Garbage in, Garbage out, 유용한 결과를 얻으려면 유용한 자료를 사용해야 함)라는 격언이 있다. 다른 무엇보다 데이터에 더 많이 적용되는 격언이다. 데이터 수집 프로세스와 관련된 시스템을 다룬 경험이 있어야 하고, 동시에 데이터 품질 문제를 발견해 해결할 수 있는 능력이 있어야 한다"고 강조했다.

데이터 분석
데이터는 원래 유용하다. 그러나 회사에 어떤 의미가 있는지 이해하지 못하면 무용지물이 되고 만다. 츄수에 따르면, 과거에는 SQL, SAS와 SPSS 같은 통계 및 모델링 도구에 대한 전문성이 있는 데이터 애널리스트를 찾는 것이 중요했다. 그러나 프로그래밍이 보편화되고, 더욱 손쉽게 배울 수 있게 되면서, 기업들이 다른 기술력을 가진 사람들을 찾고 있다.

츄수는 "기업들이 첨단 데이터 과학 역량을 구현하고 싶다면, 파이썬과 딥 러닝 라이브러리 프로그래밍 기술을 갖고 있는 사람, SQL 같은 전통적인 도구 외에도 스파크(Spark), 하둡, 하이브(Hive) 같은 빅데이터 도구 및 인프라를 다룰 수 있는 사람을 찾아 채용해야 한다"고 말했다.

또 데이터 분석을 지원할 적임자를 채용하려면 데이터를 어느 수준까지 분석할지 결정해야 한다. 무스타파는 높은 수준의 해석, 사용자 행위와 몰입, 트렌드 예측에 관심이 있다면, 데이터 과학에 대한 지식이 폭넓은 사람이 적합하다고 설명했다. 그러나 수많은 데이터를 분석하고, 예측에 초점을 맞추고 있다면 더 전문적인 기술력을 가진 인재를 채용해야 한다. 무스타파는 최적화 이론과 머신러닝에 정통한 인재가 우수한 예측 모델 구현에 도움을 줄 수 있다고 설명했다. 반면 수많은 데이터 처리가 당면 과제인 회사는 하둡과 아파치 스파크 같은 도구에 정통한 인재를 추구해야 한다.

데이터 변환
데이터가 비즈니스에 미치는 영향은 크다. 디지털 변환(Digital Transformation, 디지털 변혁 또는 전환) 시대가 열렸고, 기업들은 급변하는 기술에 보조를 맞추기 위해 애를 쓰고 있다. 이런 디지털 변환은 데이터와 이를 일상 비즈니스에 통합하는 것에 일정 부분 초점을 맞추고 있다. 튼튼한 기술적 토대가 필요하고, 이와 동시에 기업의 비즈니스를 깊이 이해해야 한다.

데이터 변환이란 데이터를 이용해 비즈니스의 미래를 만들고, 현대적이면서 혁신적인 기업으로 유지해 나가는 방법에 관한 것이다. 따라서 때론 여러 소스에서 복잡한 데이터를 평가하고, 중요한 것을 결정할 수 있는 능력을 갖춘 인재를 채용해야 한다.

무스타파는 "데이터 과학자는 정보를 집약해 데이터를 시각화할 수 있어야 한다. 시각화 기술력은 데이터로 스토리를 이야기하는데 아주 중요하다. 이는 데이터 과학자에게 가장 중요한 기술력이다. 데이터 과학자는 데이터로 스토리를 이야기하고, 데이터가 말하는 내용을 전달하는 방법으로 기업에 가치를 창출한다"고 설명했다.

소프트스킬
위에서 언급한 기술력은 대부분 기술과 관련된 기술력이다. 그러나 소프트스킬을 간과하지 않는 것이 중요하다. 데이터 수집, 웨어하우징, 해석을 위해 채용한 사람들에게는 또 다른 책임이 있다. 경영진에 효과적으로 전달하는 책임이다. 빅데이터가 새로운 트렌드로 부상하고 있지만, 모두가 이를 이해하고 있는 것은 아니다. 이런 점에서 기술적인 측면과 균형을 잡는 데 도움을 주는 커뮤니케이션 기술력을 가진 인재를 채용해야 한다.

적합한 기술 기술력을 가진 사람을 원할 것이다. 그러나 이들이 데이터와 관련해 '현상'에 도전하면서 경계를 넓히는 것도 중요하다.

폴리치는 "기업은 기술력과 툴에 대한 전문성을 갖춘 데다 정상에 도달하기 위해 헌신하는 인재를 채용해야 한다. 현재 조직에서 이용하는 툴에 정통하면서, 새로운 혁신을 가져올 수 있는 인재를 찾아야 한다"고 말했다. ciokr@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.