2017.08.22

"최고의 직업 1위"···데이터 과학자란? 역할은? 되는 방법은?

Sarah K. White | CIO
데이터 과학자가 되는 경로는 업종에 따라 다르다. 그럼에도 불구하고 공통적으로 요구되는 역량과 경력, 학위 등이 있다. 여기 데이터 과학자 커리어를 시작하는데 필요한 정보를 정리했다.



데이터 과학자란 무엇일까?
데이터 과학자(데이터 사이언티스트)는 수 많은 구조화, 비구조화 데이터에서 특정 비즈니스 니즈 성과나 목표를 달성하는 데 도움을 주는 인사이트를 발견해야 하는 책임을 갖고 있다. 데이터 분석 분야에서 데이터 과학자의 역할이 점차 더 중요해지고 있다. 기업들이 빅데이터 및 데이터 분석을 더 많이 활용해 의사 결정을 내리고, 클라우드 기술과 자동화, 머신 학습을 IT 전략의 핵심 구성 요소로 활용하는 기업들이 증가하는 추세이기 때문이다.

데이터 과학자의 주요 임무는 수 많은 데이터를 체계화 및 분석하는 것이다. 이를 위해 전용 소프트웨어를 사용하는 경우가 많다. 데이터 사이언티스가 데이터 분석을 한 최종 결과물을 모든 투자 이해 당사자가 쉽게 이해할 수 있어야 한다. 특히 IT 외부의 관계자가 이를 이해하는 것이 중요하다.

데이터 과학자가 데이터 분석에 접근하는 방법은 소속 산업, 비즈니스 니즈(필요 사항), 소속 부서에 따라 달라진다. 비즈니스 부문 리더, 부서, 매니저는 찾고자 하는 것을 미리 알려줘야 한다. 그래야 데이터 과학자가 구조화, 비구조화 데이터에서 '의미'를 찾을 수 있다. 데이터 과학자는 기업이나 부서의 목표를 예측 엔진, 패턴 감지 분석, 최적화 알고리즘 등 데이터 기반 결과물로 전환 시킬 수 있는 비즈니스 전문성을 갖추고 있어야 한다.

데이터 과학자의 연봉
2016년 노동 통계청(BLS)은 데이터 과학자의 평균 연봉이 약 11만 8,000달러라고 발표했다. 급성장하는 동시에 보수 좋은 직종이다. BLS는 이 분야의 일자리가 2024년까지 11% 증가할 것으로 내다봤다.

데이터 과학자 직종은 만족도 높은 장기 커리어 경로로 자리를 잡아가고 있다. 글래스도어의 '미국의 최고 직업 50종' 보고서에 따르면 채용 기회(공석), 보수, 전반적인 업무 만족도를 기준으로 했을 때 데이터 과학자가 최고의 직업인 것으로 분석됐다.

데이터 과학자가 하는 일
데이터 과학자의 주요 책임은 데이터 분석이다. 데이터 분석이란 데이터 수집에서 시작, 데이터 과학자의 최종 데이터 분석 결과를 바탕으로 비즈니스 의사 결정을 내리는 것으로 끝나는 프로세스다.

데이터 과학자는 통상 수 많은 소스(출처)에서 이른바 '빅데이터'를 수집해 분석한다. 빅데이터는 크게 '구조화 데이터' 및 '비 구조화 데이터' 2종으로 분류할 수 있다. 구조화 데이터는 컴퓨터가 쉽게 자동으로 분류, 판독, 조직화 할 수 있는 범주로 체계화되어 있는 데이터다. 서비스와 제품, 전자 장치가 수집하는 데이터가 여기에 포함된다. 가령 스마트폰이 수집한 GPS 좌표, 은행 계좌, 매출 통계, 웹사이트 트래픽 데이터 등이 구조화 데이터이다.

빠르게 증가하고 있는 빅데이터인 비구조화 데이터는 주로 사람이 입력한 정보에 바탕을 둔 데이터로 구성되어 있다. 고객 리뷰, 이메일, 비디오, 소셜 미디어 게시물을 예로 들 수 있다. 통상 기술을 이용해 효율적으로 분류, 체계화, 관리하기 힘들다. 간결하지 않은 비구조화 데이터를 관리하려면 많은 투자가 필요할 수 있다. 일반적으로 관련 데이터를 추출하기 위해, 키워드를 사용하는 방식으로 비구조화 데이터를 이해하기 쉽게 만든다.

기업은 통상 데이터 과학자가 비구조화 데이터를 처리하도록 만든다. 그리고 다른 IT 분야 전문가가 구조화 데이터 관리 및 유지를 책임치곤 한다. 데이터 과학자 또한 구조화 데이터를 다루곤 하지만 비즈니스에 비구조화 데이터를 사용하기 원하는 기업이 증가하고 있는 추세이다. 따라서 비구조화 데이터가 데이터 과학자 역할의 핵심이 되고 있다.

데이터 과학자에게 요구되는 사항
산업마다 데이터 과학자가 분석해야 할 빅데이터 프로필이 다르다. 다음은 BLS 자료를 기준으로 했을 때, 데이터 사이언티스가 수행해야 하는 분석과 빅데이터의 종류를 산업 및 업무 별로 정리한 내용이다.

- 영업 : 현재 데이터가 사실상 모든 기업의 비즈니스 전략을 결정한다. 그러나 이를 위해서는 데이터 사이언티스가 정보를 이해할 수 있도록 만들어야 한다. 비즈니스 데이터 분석은 효율성, 재고, 생산 오류, 고객 로열티 등과 관련된 의사 결정에 도움을 주는 정보를 제공한다.

- 전자상거래 : 이제 웹사이트는 구매 데이터 '이상'을 수집한다. 데이터 과학자전자상거래 사업체의 고객 서비스 개선, 트렌드 파악, 서비스나 제품 개발에 도움을 주고 있다.

- 금융 : 금융 산업에서는 계좌 신용 및 차변 거래에 대한 데이터, 기타 이와 유사한 금융 데이터가 기업 활동에 아주 중요한 역할을 한다. 그러나 이 분야의 데이터 과학자들은 사기 및 부정 행위 감지 등 보안과 컴플라이언스(규제 또는 정책 준수)도 크게 중시해야 한다.

- 공공 : 빅데이터는 정부의 정책 결정, 선거 구민 지원, 만족도 모니터링에 도움을 준다. 또 금융 부문과 마찬가지로 보안과 컴플라이언스를 중요하게 취급해야 한다.




2017.08.22

"최고의 직업 1위"···데이터 과학자란? 역할은? 되는 방법은?

Sarah K. White | CIO
데이터 과학자가 되는 경로는 업종에 따라 다르다. 그럼에도 불구하고 공통적으로 요구되는 역량과 경력, 학위 등이 있다. 여기 데이터 과학자 커리어를 시작하는데 필요한 정보를 정리했다.



데이터 과학자란 무엇일까?
데이터 과학자(데이터 사이언티스트)는 수 많은 구조화, 비구조화 데이터에서 특정 비즈니스 니즈 성과나 목표를 달성하는 데 도움을 주는 인사이트를 발견해야 하는 책임을 갖고 있다. 데이터 분석 분야에서 데이터 과학자의 역할이 점차 더 중요해지고 있다. 기업들이 빅데이터 및 데이터 분석을 더 많이 활용해 의사 결정을 내리고, 클라우드 기술과 자동화, 머신 학습을 IT 전략의 핵심 구성 요소로 활용하는 기업들이 증가하는 추세이기 때문이다.

데이터 과학자의 주요 임무는 수 많은 데이터를 체계화 및 분석하는 것이다. 이를 위해 전용 소프트웨어를 사용하는 경우가 많다. 데이터 사이언티스가 데이터 분석을 한 최종 결과물을 모든 투자 이해 당사자가 쉽게 이해할 수 있어야 한다. 특히 IT 외부의 관계자가 이를 이해하는 것이 중요하다.

데이터 과학자가 데이터 분석에 접근하는 방법은 소속 산업, 비즈니스 니즈(필요 사항), 소속 부서에 따라 달라진다. 비즈니스 부문 리더, 부서, 매니저는 찾고자 하는 것을 미리 알려줘야 한다. 그래야 데이터 과학자가 구조화, 비구조화 데이터에서 '의미'를 찾을 수 있다. 데이터 과학자는 기업이나 부서의 목표를 예측 엔진, 패턴 감지 분석, 최적화 알고리즘 등 데이터 기반 결과물로 전환 시킬 수 있는 비즈니스 전문성을 갖추고 있어야 한다.

데이터 과학자의 연봉
2016년 노동 통계청(BLS)은 데이터 과학자의 평균 연봉이 약 11만 8,000달러라고 발표했다. 급성장하는 동시에 보수 좋은 직종이다. BLS는 이 분야의 일자리가 2024년까지 11% 증가할 것으로 내다봤다.

데이터 과학자 직종은 만족도 높은 장기 커리어 경로로 자리를 잡아가고 있다. 글래스도어의 '미국의 최고 직업 50종' 보고서에 따르면 채용 기회(공석), 보수, 전반적인 업무 만족도를 기준으로 했을 때 데이터 과학자가 최고의 직업인 것으로 분석됐다.

데이터 과학자가 하는 일
데이터 과학자의 주요 책임은 데이터 분석이다. 데이터 분석이란 데이터 수집에서 시작, 데이터 과학자의 최종 데이터 분석 결과를 바탕으로 비즈니스 의사 결정을 내리는 것으로 끝나는 프로세스다.

데이터 과학자는 통상 수 많은 소스(출처)에서 이른바 '빅데이터'를 수집해 분석한다. 빅데이터는 크게 '구조화 데이터' 및 '비 구조화 데이터' 2종으로 분류할 수 있다. 구조화 데이터는 컴퓨터가 쉽게 자동으로 분류, 판독, 조직화 할 수 있는 범주로 체계화되어 있는 데이터다. 서비스와 제품, 전자 장치가 수집하는 데이터가 여기에 포함된다. 가령 스마트폰이 수집한 GPS 좌표, 은행 계좌, 매출 통계, 웹사이트 트래픽 데이터 등이 구조화 데이터이다.

빠르게 증가하고 있는 빅데이터인 비구조화 데이터는 주로 사람이 입력한 정보에 바탕을 둔 데이터로 구성되어 있다. 고객 리뷰, 이메일, 비디오, 소셜 미디어 게시물을 예로 들 수 있다. 통상 기술을 이용해 효율적으로 분류, 체계화, 관리하기 힘들다. 간결하지 않은 비구조화 데이터를 관리하려면 많은 투자가 필요할 수 있다. 일반적으로 관련 데이터를 추출하기 위해, 키워드를 사용하는 방식으로 비구조화 데이터를 이해하기 쉽게 만든다.

기업은 통상 데이터 과학자가 비구조화 데이터를 처리하도록 만든다. 그리고 다른 IT 분야 전문가가 구조화 데이터 관리 및 유지를 책임치곤 한다. 데이터 과학자 또한 구조화 데이터를 다루곤 하지만 비즈니스에 비구조화 데이터를 사용하기 원하는 기업이 증가하고 있는 추세이다. 따라서 비구조화 데이터가 데이터 과학자 역할의 핵심이 되고 있다.

데이터 과학자에게 요구되는 사항
산업마다 데이터 과학자가 분석해야 할 빅데이터 프로필이 다르다. 다음은 BLS 자료를 기준으로 했을 때, 데이터 사이언티스가 수행해야 하는 분석과 빅데이터의 종류를 산업 및 업무 별로 정리한 내용이다.

- 영업 : 현재 데이터가 사실상 모든 기업의 비즈니스 전략을 결정한다. 그러나 이를 위해서는 데이터 사이언티스가 정보를 이해할 수 있도록 만들어야 한다. 비즈니스 데이터 분석은 효율성, 재고, 생산 오류, 고객 로열티 등과 관련된 의사 결정에 도움을 주는 정보를 제공한다.

- 전자상거래 : 이제 웹사이트는 구매 데이터 '이상'을 수집한다. 데이터 과학자전자상거래 사업체의 고객 서비스 개선, 트렌드 파악, 서비스나 제품 개발에 도움을 주고 있다.

- 금융 : 금융 산업에서는 계좌 신용 및 차변 거래에 대한 데이터, 기타 이와 유사한 금융 데이터가 기업 활동에 아주 중요한 역할을 한다. 그러나 이 분야의 데이터 과학자들은 사기 및 부정 행위 감지 등 보안과 컴플라이언스(규제 또는 정책 준수)도 크게 중시해야 한다.

- 공공 : 빅데이터는 정부의 정책 결정, 선거 구민 지원, 만족도 모니터링에 도움을 준다. 또 금융 부문과 마찬가지로 보안과 컴플라이언스를 중요하게 취급해야 한다.


X