Offcanvas

AI / CIO / How To / 디지털 트랜스포메이션 / 머신러닝|딥러닝 / 의료|의학

'경험자가 전하는' 머신러닝 도입 팁 10가지

2017.09.14 Clint Boulton  |  CIO
인공지능 및 머신러닝 기술이 비즈니스 판도를 바꾸는 솔루션들을 낳아가고 있다. 여기 CIO를 비롯한 IT 의사결정자들이 성공적인 머신러닝 전략을 수립해 출범하고 유지하는 과정에서 필요한 팁들을 정리했다.

“앞서가는 사고를 하는 CIO인가를 판단하는 기준으로 머신러닝(Machine learning, ML)이 떠오르고 있다. 제품 개발 및 비즈니스 운영 과정에서 ML을 도입하지 못하는 기업들은 재빠르게 움직인 경쟁 기업들에게 뒤쳐질 각오를 해야 한다.”

RELX 그룹의 과학 및 건강 정보 유닛인 엘스비어(Elsevier) CTO인 댄 올리가 내린 결론이다. 그 또한 몇 년 전부터 ML 기술의 도입을 추진해왔다.

“나는 우리가 머신러닝 기술의 티핑 포인트에 도달했다고 믿는다. 그리고 머신러닝은 향후 십 수년간 우리가 디지털 세계와 상호작용 하는 방식을 완전히 바꾸어 놓을 것이다. 우리의 의사 결정은 점차 기계가 대신하게 될 것이다”라고 지난달 콜로라도 주 콜로라도 스프링스에서 열린 CIO100 심포지엄에서 그는 청중을 향해 말했다.

이는 충분히 일리 있는 말이다. 컴퓨팅 파워의 증대, 점점 더 정교해져 가는 알고리즘과 트레이닝 모델, 그리고 무제한적 데이터 소스의 등장으로 인공지능 혁신이 가능해지고 있다. 기계가 인간의 행위와 생각을 모방하는 테크놀로지들을 총칭하는 인공지능, 즉 AI는 그 하위 분야로써 통계 기반 알고리즘이 지식 엔지니어링을 자동화하는 메커니즘인 머신러닝을 포함한다.

구글, 아마존, 바이두 등 기업들도 AI, ML 기술에 돈을 아낌 없이 퍼붓고 있다. 게다가 이러한 기업들의 개발 성과들로 인해 해당 분야에 대한 투자액은 그 전 3년동안의 투자액에 비해 2016년에 3배 가까이(약 260억 달러에서 390억 달러 가량) 증가하였다고 맥킨지 글로벌 인스티튜트(McKinsey Global Institute)는 밝혔다.

AI와 ML 도입의 적기는 ‘지금’이다
기술 분야 외에서의 AI 도입은 아직까지 초기의 실험적 단계에 머물고 있으며 이를 대규모로 도입하는 기업들은 찾아보기 힘들다고 맥킨지 보고서는 밝히고 있다. 보고서에 따르면 아직까지 AI를 대규모로, 혹은 비즈니스의 핵심적 부분으로 받아들이지 않고 있는 이유는 AI 투자를 통해 어느 정도의 수익을 얻을 수 있을지에 대한 확신이 없기 때문이다.

그렇지만 올리의 생각은 다르다. 엘스비어는 ML 도입을 통해 제약회사 클라이언트들이 적절한 의료 정보를 찾고 약품 종류를 결정해 이를 의료진들에게 제공할 수 있었다는 점에서 ML도입을 성공적으로 평가하고 있다. 때문에 올리는 ML이 탤런트 관리, 세일즈 및 마케팅, 고객 지원 등 여러 분야에서 유용하게 쓰일 수 있다고 강조했다.

타사에 비해 비교 우위를 얻고 싶거나, 최소한 조금이라도 앞서 가고 싶은 CIO라면 지금 당장 자리를 박차고 일어나 이러한 새로운 테크놀로지를 수용해야 한다. “적기가 있다면 지금 당장이다”라고 올리는 조언했다.

AI 알고리즘에 전혀 익숙하지 않은 기관들이 어떻게 데이터 과학이나 ML같은 테크놀로지에 접근해야 할까? 그런 기업들을 위해 올리와 가트너가 10가지 팁을 제시했다.

1. 데이터 과학이 현장에 섞여 들도록 하라
기업에 데이터 과학 및 ML 기술을 적용하고 싶다는 생각은 있지만, 도대체 어디서부터 시작해야 하는 걸까? 우선, 데이터 과학 및 ML 오퍼레이션을 반드시 중앙화할 필요는 없다는 점을 기억할 만하다. 세일즈, 마케팅, HR, 금융 등 다양한 부서에 각각 데이터 과학 및 머신러닝 기술을 적용하는 것이 더 나을 수 있다.

올리는 데이터 과학자와 소프트웨어 엔지니어, 또는 종양학 전문가를 짝지어 스포티파이(Spotify) 모델에 기반한 애자일 스쿼드(agile squad)로 상품을 개발하도록 했던 엘스비어 사에서의 자신의 경험을 바탕으로 다른 CIO들에게 다음과 같이 조언했다.

“우리는 데이터 과학 팀을 제품 관리팀과 비즈니스 유닛에 섞여 들도록 했다. 이들을 하나의 유닛처럼 대하되 전체 유닛을 이끌어갈 사람을 따로 정했다. 또한 최대한 문제 해결에 데이터 과학자가 깊이 관여할 수 있도록 했는데 왜냐하면 기업 전반에 걸친 ML 기술의 확장 적용을 위해서는 그것이 최선이라고 판단했기 때문이다”라고 올리는 말했다.

2. 일단 시작하라
데이터 과학 기술 적용을 위해 거창한 플랜이 필요한 건 아니다. 혹은 그럴듯한 ML 제품 개발을 위해 거창한 프레임워크가 필요하지도 않다. 여러 비즈니스 분야에서 특정 AI 테크놀로지를 적용하여 소규모 실험적 프로젝트들을 우선 진행해 보고 그러한 시도로부터 수익이 아닌 경험과 학습을 목표로 하는 것이 첫 시작이 되어야 한다고 가트너는 강조했다.

올리는 “아직까지도 이러한 기술들의 도입을 시작하지 않았다면, 지금 당장 시작하기를 권한다. 적어도 당신의 경쟁사들은 이미 머신러닝에 뛰어들고 있다”라고 말했다.

3. 데이터 보기를 금같이 하라
데이터는 AI, ML 기술의 연료 같은 역할을 한다. 따라서 CIO들은 데이터를 마치 돈처럼 관리하고, 지키며, 귀중하게 여겨야 한다. “CFO는 아무렇게나 예산 승인을 내리고, 아무 데에나 지출을 결정하지 않는다. 또한 올 해 수익이 어느 정도였는지도 어림 짐작으로 계산하는 것이 아니라 철저한 분석을 통해 접근한다. 이러한 접근법이 CIO에게도 요구된다”라고 올리는 말했다.

-> 데이터가 '자산'되는 시대... CFO에게 닥친 과제

4. 완벽한 구직자는 상상 속에만 존재한다
데이터 과학자들은 어떤 역량을 가져야 할까? 알고리즘을 직접 쓰고 제품을 만들어 낼 수 있는 소프트웨어 엔지니어들은 아닐지라도, 대개 수학, 통계학에 높은 적성도를 보이며 데이터 속에서 유의미한 정보와 통찰력을 얻는데 능숙한 정도면 무난하다.

애석하게도 대부분 기업들은 통계학, 소프트웨어 엔지니어링에 모두 능숙하면서도 헬스케어면 헬스케어, 금융 서비스면 금융 서비스 등 해당 분야의 전문 지식까지 꿰차고 있는 상상 속에서나 존재할 법한 직원을 찾는 경향이 있다고 올리는 지적했다.

“실제로 내가 아는 어떤 사람은 ‘소프트웨어 엔지니어이면서 수학 박사 학위도 가지고 있으면 좋을 것 같고, 그러면서도 환자를 상대해 본 의사였으면 좋겠다. 특히 종양학 전문의라면 더할 나위 없을 것 같다’라는 꿈같은 이야기를 하기도 했다. 소프트웨어 엔지니어와 수학 박사, 그리고 의사를 따로따로 세 명 알고는 있지만 그 셋을 한 몸에 합친 사람을 알지는 못한다”라고 올리는 말했다.

5. 데이터 과학 교육 커리큘럼을 마련하라
데이터 과학 기술을 보유한 모든 이가 데이터 과학자이거나, 이 기술에 있어서 전문가나 장인이 될 필요는 없다. “실제로 고도의 전문성을 갖춘 데이터 과학자는 흔하지 않으므로, 일정 수준의 지식을 갖춘 이들을 훈련시키는 방법을 찾는 게 빠르다”라고 올리는 말했다.

올리 역시 IT 직원이나 데이터 과학 담당자를 교육해 이들의 ‘수준을 끌어올리는’ 역할을 따로 전담하는 전담자를 두고 있다.

엘스비어 사는 또 온라인 강의 코세라(Coursera)의 도움을 받고 있다. 올리는 CIO들에게, 최소한 확률 및 통계에 대한 지식을 새롭게 상기시켜 줄 수 있도록 해당 분야의 수업을 창설하고, 해당 직무의 적임자임을 입증하기 위해 지원자들에게 시험을 보게 할 것을 권했다. 가트너 또한 AI 인재 풀에 존재하는 수요와 공급간의 간극을 인지하고 기준에 조금 못 미치는 인재라 해도 일단 뽑아 교육을 시킬 수 있도록 계획을 세워야 한다고 조언했다.

6. 커뮤니티 플랫폼의 사용도 고려해보라
AI나 ML 기술을 도입하는 기업들, 혹은 데이터 과학과 관련한 문제를 어떻게 해결해야 좋을지 확신이 없는 기업들은 캐글(Kaggle)같은 데이터 과학 플랫폼에 의지하는 것도 하나의 방법이다. 캐글 같은 전문 플랫폼은 어려운 문제를 해결하는 것이 취미인 데이터 과학자들, 통계전문가, 금융 전문가, 소프트웨어 프로그래머 등 일련의 전문가들이 모여 기업의 비즈니스 문제를 해결해주는 데 특화된 플랫폼이기 때문이다.

7. 데이터 공유에 신중하라
만일 파트너와 알고리즘을 공유할 예정이라면 그 파트너가 데이터를 보게 될 것이라는 것도 알아야 한다. 이런 상황은 엘스비어 같은, 정보가 비교 우위의 원천이고 정보 보호에 예민한 기업들에게는 그다지 바람직하지 않다.

“데이터는 새로운 화폐와도 같다. 어떤 데이터를 보호하고, 어떤 데이터까지는 기꺼이 공유할 수 있는가를 사전에 판단해 두어야 한다”라고 올리는 말했다.

8. 모든 문제를 한 번에 해결하려 하지 말라
며칠 전부터 예약을 잡지 않으면 얼굴조차 보기 힘든 1차 의료기관의 의사들을 대신할 의료 알고리즘 개발하는 시도가 이제 상상을 넘어 현실이 됐다. 이제는 환자가 단순히 진통제 정도만 처방하면 되는 환자인지, 좀 더 심층적인 검사와 치료를 요하는지 정도는 분간할 수 있는 알고리즘을 개발해 문제를 해결하는 헬스케어 기업들이 있다. 올리는 “작은 문제들부터 하나씩 해결해 나가야 한다. 더 많은 데이터를 수집하고, 시간을 가지고 천천히 쌓아 나가야 한다”고 올리는 말했다.

9. 데이터 모델에 중요성을 지나치게 부여하지 말라
완벽한 데이터 모델을 갖추는 것보다 제대로 된 교육 모델을 갖추는 것이 더 중요하다. 아무에게나 함부로 데이터를 맡기다 보면 데이터 모델의 퀄리티가 급격히 하락할 수 있다고 올리는 경고했다.

“가장 어려운 부분은 직원들에게 가능성을 보여주고, 이들에게 그러한 기술로 실현할 수 있는 가능성을 자유롭게 탐색하도록 자유를 주는 일이다”라고 올리는 말했다.

10. CEO와 이사회를 지속적으로 설득하라
데이터 과학 파일럿 프로젝트가 상당히 희망적인 상황이라면, CIO의 다음 임무는 AI와 ML 기술이 기존의 비즈니스 모델을 새롭게 만들어 낼 수 있는 잠재력을 지녔다는 사실을 CEO 및 이사회에게 알리는 것이라고 가트너는 강조했다. 성공적인 머신러닝 오퍼레이션은 기업의 미래를 바꾸는 열쇠가 될 수도 있다.
---------------------------------------------------------------
머신러닝 How To 인기기사
->우리 회사는 AI·머신러닝에 준비돼 있을까?··· '10가지 체크리스트'
->기계학습 구현을 쉽게!··· 머신러닝 프레임워크 13종
->머신러닝을 시작하는 방법, '텐서플로우 통해 머신러닝을 기업 DNA에 각인시켜라'
->데이터 과학자·머신러닝을 비즈니스에 활용하는 방법(태도)
->지금 CIO가 머신러닝에 투자해야··· 왜? 어떻게?
->기업 4곳이 전하는 'AI 조직' 구축법
->'IT업무도 AI가···' CIO는 무엇을 준비해야 하나
->'데이터 입력, 지능 출력' 알기 쉽게 설명하는 머신러닝 파이프라인
->요즘 화제 '챗봇'··· CMO가 알아야 할 7가지
---------------------------------------------------------------
ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.