2021.02.05

칼럼 | 2021년 데이터 과학 예측 7가지

Nick Elprin | CIO
그 어떤 해와도 달랐던 한 해를 보낸 후 필자는 긍정적인 생각으로 2021년을 바라보고 있다. 코로나19 대유행을 억제하고 일상을 (어느 정도) 되돌려 준다고 약속하는 코로나19 백신에 더해 기업들은 물론 정부가 ‘평소의 업무’로 복귀하면서 새로워질 경제와 전세계적인 안정도 기대하고 있다.

코로나바이러스로 거의 모든 시장 부문이 타격을 받은 가운데 기술 부문은 특히 큰 와해를 겪었다. 제조에서부터 공급망, 물류, 소매, 소비자 수요에 이르기까지, 기업들은 빠르게 전환을 해야 했으며 한 번이 아닌 두세 번의 전환이 필요한 경우도 많았다. 그런데 기술은 이미 올해에 대한 긍정적인 지표를 보이고 있으며 데이터 과학 분야에서 몇 가지 확실한 동향이 눈에 띈다. 이미 등장하기 시작한 7가지 동향을 소개한다.
 
Image Credit : Getty Images Bank


데이터 과학 분야의 투자가 지속적으로 늘어난다
코로나19 영향 극복과 업무 실행을 위해 조직들은 여러 분야에서 예산을 대폭 삭감했었다. 그러나 2021년에는 데이터 과학에 대한 투자를 유지하거나 심지어 늘릴 회사가 많을 것으로 필자는 내다보고 있다. 코로나19로 급히 원격 근무자 지원에 나서면서 포춘500대 기업들은 퍼블릭 클라우드 및 최신 데이터 과학 도구로의 이전에 박차를 가했다. 이는 전면적인 데이터 과학 투자를 가로막는 마지막 남은 장벽 가운데 하나였다. 

이제 봉인이 해제되었기 때문에 조직들의 계속적인 투자가 쉬워졌으며, 여러 포춘 500대 기업들이 머신러닝(ML) 및 데이터 과학 분야의 핵심 역량 구축에 투자하고 있다. 경쟁업체보다 더 빠르고/똑똑하고/잘하기 위해 ‘큰 승부’를 거는 것이다.

코로나19로 인해 모델 모니터링 솔루션의 개발이 가속화된다
코로나19로 업무 운영의 거의 모든 측면이 엄청난 타격을 입었으며 인공지능(AI) 및 머신러닝(ML)에 의존하여 업무 의사결정을 자동화하던 조직들이 특히 취약해졌다. 회사들이 겪고 있는 가장 큰 문제 가운데 하나는 막대한 데이터 드리프트(drift) 현상이다. 데이터 드리프트 현상이란, 코로나19 대유행 이후로 인간 행동이 대규모로 달라지면서 모델 입력 값이 달라짐에 따라 성능 저하와 부정확한 출력 값으로 이어지는 현상을 말한다. 

각 조직이 데이터 드리프트를 잡아낼 수 있게 해 주는 새롭고 더욱 강력한 모델 모니터링 솔루션의 개발에 투자할 것이다. 이는 2021년도의 엄청난 혁신 및 투자 분야가 될 전망이다.

새 ‘보안관’이 등장한다
2021년에는 회사들이 모델 뒤의 ‘데이터’에 치중하던 것에서 AI/ML 모델 자체로 옮겨감에 따라 전통적인 최고 데이터 책임자를 대체할 최고 분석 책임자(CAO)와 최고 데이터 분석 책임자(CDAO)가 이사회의 새 얼굴이 될 것이다.

모델 위험성에 대한 인식이 확산된다
금융서비스 회사들은 오랫동안 예측 모델을 활용해 규정 검토 대상의 의사결정을 주도해 왔으며 이러한 방식과 관련된 위험도 함게 파악해 왔다. 2021년에는 좀더 다양한 업계에 걸쳐 자동화된 의사결정의 위험과 법적 함의에 대한 의식이 넓게 퍼지게 될 것이다. 또한, 모델이 내린 의사결정으로 생긴 법적 책임이나 차별과 관련된 대중 소송사건을 보게 될 가능성이 높다. 회사들은 가격 책정과 사업 관행에 대해 강화된 조사 속에 책임을 묻게 되므로 ‘AI가 시켰다’는 변명이 통하지 않을 것이다.

IT 조직들은 데이터 과학 ‘섀도우 IT’ 관리 권한을 얻게 된다
지금까지 데이터 과학은 기업 내의 중앙집중화 플랫폼과 적절한 통제관리가 모두 부족했다. 이는 만연한 ‘섀도우 IT’ 관행으로 이어졌다. 예를 들면, 데이터 과학자들이 미승인 도구 및 데이터 과학 패키지를 내려 받고 비공식 인프라를 저장과 특수 연산 능력에 사용하는 것이다. 

갈수록 데이터 과학의 보급이 늘어나고 모든 업무 기능에 필수적으로 자리잡아가는 상황에서 이처럼 파편화된 시스템은 보안의 관점은 물론 IT의 관점으로도 더 이상 옹호할 수 없다. 코로나로 인한 정리해고 등으로 대대적인 조직 변화를 겪은 회사들이 코로나 이후에 가격 책정을 어떻게 업데이트를 해야할 지 알 수 없게 되어 버린 경우가 있었다. 일부 데이터 과학 팀은 자체적인 시스템을 바탕으로 가격 책정 모델을 구축했기 때문이었다. 

올해에는 더 많은 조직들이 모델을 유형 자산으로 취급하여 IT에서 통제권을 갖도록 동기부여를 하고 데이터 과학을 규모 있게 지원하기 위한 인프라를 제공하는 모습을 보게 될 것이다.  

알고리즘 및 예측 모델 사용에 투명성을 보장하라는 압박이 증가한다
AI 엔지니어링 기능이 늘어나면서 더 훌륭한 구조와 정교함으로 모델을 생산 단계로 끌고 갈 수 있게 된 반면, 빠르게 진화하는 개인정보보호 표준(예: GDRP 및 CCAP)을 준수하려면 AI 모델의 투명성과 보안성 증가에도 똑같이 신경 써야 한다. 

그러나 쉽지 않을 것이다. 모델옵스(ModelOps), 데브옵스(DevOps), 모델 위험 관리, 설명 가능한 AI, 프로세스와 기술의 발전을 모두 요구하는 윤리적 AI 등이 수반되는 매우 힘든 작업이 필요할 것이기 때문이다.

데이터 과학 교육 프로그램이 확산된다
닷컴 붐이 컴퓨터 과학 수업과 전공에 대한 관심을 고조시킨 것처럼 2021년에는 모델이 갈수록 사업과 경제의 모든 부분을 주도함에 따라 데이터 과학 수업과 학위에 대한 수요가 급등할 것이다. 데이터 과학 수업이 제공되는 학교에서는 신입생들에게 특히 인기 높은 수업이 될 것이다.

위와 같은 예측의 핵심은 데이터 과학이 업무 관행에 더욱 깊이 배어들고 있다는 점이다. 과거에는 데이터 과학이 조직 내에서 구분되고 고립되어 있었던 반면, 2021년은 데이터 과학이 모든 업무 및 기능 부서에 영향을 미치는 전사적인 기능이 될 해이다.

위와 같은 필자의 예측을 올해 말에 돌아보면서 몇 가지가 실현되었고 몇 가지가 완전히 빗나갔는지 살펴보면 흥미로울 것이다. 개인적으로 90% 이상의 정확도를 장담한다. 

* Nick Elprin은 도미도 데이터 랩 공동 설립자이자 CEO다. ciokr@idg.co.kr



2021.02.05

칼럼 | 2021년 데이터 과학 예측 7가지

Nick Elprin | CIO
그 어떤 해와도 달랐던 한 해를 보낸 후 필자는 긍정적인 생각으로 2021년을 바라보고 있다. 코로나19 대유행을 억제하고 일상을 (어느 정도) 되돌려 준다고 약속하는 코로나19 백신에 더해 기업들은 물론 정부가 ‘평소의 업무’로 복귀하면서 새로워질 경제와 전세계적인 안정도 기대하고 있다.

코로나바이러스로 거의 모든 시장 부문이 타격을 받은 가운데 기술 부문은 특히 큰 와해를 겪었다. 제조에서부터 공급망, 물류, 소매, 소비자 수요에 이르기까지, 기업들은 빠르게 전환을 해야 했으며 한 번이 아닌 두세 번의 전환이 필요한 경우도 많았다. 그런데 기술은 이미 올해에 대한 긍정적인 지표를 보이고 있으며 데이터 과학 분야에서 몇 가지 확실한 동향이 눈에 띈다. 이미 등장하기 시작한 7가지 동향을 소개한다.
 
Image Credit : Getty Images Bank


데이터 과학 분야의 투자가 지속적으로 늘어난다
코로나19 영향 극복과 업무 실행을 위해 조직들은 여러 분야에서 예산을 대폭 삭감했었다. 그러나 2021년에는 데이터 과학에 대한 투자를 유지하거나 심지어 늘릴 회사가 많을 것으로 필자는 내다보고 있다. 코로나19로 급히 원격 근무자 지원에 나서면서 포춘500대 기업들은 퍼블릭 클라우드 및 최신 데이터 과학 도구로의 이전에 박차를 가했다. 이는 전면적인 데이터 과학 투자를 가로막는 마지막 남은 장벽 가운데 하나였다. 

이제 봉인이 해제되었기 때문에 조직들의 계속적인 투자가 쉬워졌으며, 여러 포춘 500대 기업들이 머신러닝(ML) 및 데이터 과학 분야의 핵심 역량 구축에 투자하고 있다. 경쟁업체보다 더 빠르고/똑똑하고/잘하기 위해 ‘큰 승부’를 거는 것이다.

코로나19로 인해 모델 모니터링 솔루션의 개발이 가속화된다
코로나19로 업무 운영의 거의 모든 측면이 엄청난 타격을 입었으며 인공지능(AI) 및 머신러닝(ML)에 의존하여 업무 의사결정을 자동화하던 조직들이 특히 취약해졌다. 회사들이 겪고 있는 가장 큰 문제 가운데 하나는 막대한 데이터 드리프트(drift) 현상이다. 데이터 드리프트 현상이란, 코로나19 대유행 이후로 인간 행동이 대규모로 달라지면서 모델 입력 값이 달라짐에 따라 성능 저하와 부정확한 출력 값으로 이어지는 현상을 말한다. 

각 조직이 데이터 드리프트를 잡아낼 수 있게 해 주는 새롭고 더욱 강력한 모델 모니터링 솔루션의 개발에 투자할 것이다. 이는 2021년도의 엄청난 혁신 및 투자 분야가 될 전망이다.

새 ‘보안관’이 등장한다
2021년에는 회사들이 모델 뒤의 ‘데이터’에 치중하던 것에서 AI/ML 모델 자체로 옮겨감에 따라 전통적인 최고 데이터 책임자를 대체할 최고 분석 책임자(CAO)와 최고 데이터 분석 책임자(CDAO)가 이사회의 새 얼굴이 될 것이다.

모델 위험성에 대한 인식이 확산된다
금융서비스 회사들은 오랫동안 예측 모델을 활용해 규정 검토 대상의 의사결정을 주도해 왔으며 이러한 방식과 관련된 위험도 함게 파악해 왔다. 2021년에는 좀더 다양한 업계에 걸쳐 자동화된 의사결정의 위험과 법적 함의에 대한 의식이 넓게 퍼지게 될 것이다. 또한, 모델이 내린 의사결정으로 생긴 법적 책임이나 차별과 관련된 대중 소송사건을 보게 될 가능성이 높다. 회사들은 가격 책정과 사업 관행에 대해 강화된 조사 속에 책임을 묻게 되므로 ‘AI가 시켰다’는 변명이 통하지 않을 것이다.

IT 조직들은 데이터 과학 ‘섀도우 IT’ 관리 권한을 얻게 된다
지금까지 데이터 과학은 기업 내의 중앙집중화 플랫폼과 적절한 통제관리가 모두 부족했다. 이는 만연한 ‘섀도우 IT’ 관행으로 이어졌다. 예를 들면, 데이터 과학자들이 미승인 도구 및 데이터 과학 패키지를 내려 받고 비공식 인프라를 저장과 특수 연산 능력에 사용하는 것이다. 

갈수록 데이터 과학의 보급이 늘어나고 모든 업무 기능에 필수적으로 자리잡아가는 상황에서 이처럼 파편화된 시스템은 보안의 관점은 물론 IT의 관점으로도 더 이상 옹호할 수 없다. 코로나로 인한 정리해고 등으로 대대적인 조직 변화를 겪은 회사들이 코로나 이후에 가격 책정을 어떻게 업데이트를 해야할 지 알 수 없게 되어 버린 경우가 있었다. 일부 데이터 과학 팀은 자체적인 시스템을 바탕으로 가격 책정 모델을 구축했기 때문이었다. 

올해에는 더 많은 조직들이 모델을 유형 자산으로 취급하여 IT에서 통제권을 갖도록 동기부여를 하고 데이터 과학을 규모 있게 지원하기 위한 인프라를 제공하는 모습을 보게 될 것이다.  

알고리즘 및 예측 모델 사용에 투명성을 보장하라는 압박이 증가한다
AI 엔지니어링 기능이 늘어나면서 더 훌륭한 구조와 정교함으로 모델을 생산 단계로 끌고 갈 수 있게 된 반면, 빠르게 진화하는 개인정보보호 표준(예: GDRP 및 CCAP)을 준수하려면 AI 모델의 투명성과 보안성 증가에도 똑같이 신경 써야 한다. 

그러나 쉽지 않을 것이다. 모델옵스(ModelOps), 데브옵스(DevOps), 모델 위험 관리, 설명 가능한 AI, 프로세스와 기술의 발전을 모두 요구하는 윤리적 AI 등이 수반되는 매우 힘든 작업이 필요할 것이기 때문이다.

데이터 과학 교육 프로그램이 확산된다
닷컴 붐이 컴퓨터 과학 수업과 전공에 대한 관심을 고조시킨 것처럼 2021년에는 모델이 갈수록 사업과 경제의 모든 부분을 주도함에 따라 데이터 과학 수업과 학위에 대한 수요가 급등할 것이다. 데이터 과학 수업이 제공되는 학교에서는 신입생들에게 특히 인기 높은 수업이 될 것이다.

위와 같은 예측의 핵심은 데이터 과학이 업무 관행에 더욱 깊이 배어들고 있다는 점이다. 과거에는 데이터 과학이 조직 내에서 구분되고 고립되어 있었던 반면, 2021년은 데이터 과학이 모든 업무 및 기능 부서에 영향을 미치는 전사적인 기능이 될 해이다.

위와 같은 필자의 예측을 올해 말에 돌아보면서 몇 가지가 실현되었고 몇 가지가 완전히 빗나갔는지 살펴보면 흥미로울 것이다. 개인적으로 90% 이상의 정확도를 장담한다. 

* Nick Elprin은 도미도 데이터 랩 공동 설립자이자 CEO다. ciokr@idg.co.kr

X