2018.04.20

'AI가 BI를 만났을 때' 더 똑똑해지고 유용해진다

Maria Korolov | CIO

데이터 과학이 대중화되고 있다. 데이터 과학자들이 데이터를 취합하고 분석하기까지 몇 달이 걸렸지만, 이제는 현업 사용자가 신속하게 데이터를 며칠 안에 모을 수 있게 됐다.



머신러닝이 약속하는 데이터 분석을 활용에서 의외의 기술이 등장한다. 바로 비즈니스 인텔리전스(BI)다. 성과 분석 영역이었던 BI 시스템을 인공지능으로 재단장하여 기존의 보고 기능에 예측 기능까지 결합하려는 것이다.

이러한 시도를 하는 조직 중 하나가 심포니 포스트 어큐트 네트워크(Symphony Post Acute Network)다. 미국 일리노이, 인디애나, 위스콘신주 28개 의료시설에 5,000개의 침상을 보유한 의료회사인 심포니는 무릎 수술 등에서 회복 중이거나 투석 치료를 받는 연 8만 명의 환자에 대한 간호를 개선하고자 인공지능과 머신러닝을 활용하고자 했다. 예를 들면, 어떤 환자는 특히 낙상 위험이 있으므로 주의를 더욱 기울여야 한다는 점을 찾아낼 수도 있기 때문이다.

개별적인 데이터 포인트나 미묘한 데이터 패턴으로 나타날 수 있는 이러한 지표를 찾아내는 것이야말로 머신러닝의 완벽한 활용 사례다. 그러나 모델 구축 작업은 간단하지 않다.

심포니의 데이터 과학 및 분석 책임자 네이선 패트릭 테일러는 “예측에 관해 질문 공세를 받았다”고 밝혔다. “온종일 머신러닝 모델 구축에 매달린다고 해도 그 모든 것을 혼자 다 해내는 것은 불가능하다”고 덧붙였다.

심포니는 2명의 데이터 과학자를 추가로 채용했다. 테일러는 “이들의 몸값이 비싸다. 그런데 우리가 필요로 한 결과를 얻지 못하고 있었다. 매우 어렵고 비용이 많이 드는 일이었다”고 말했다.

그래서 2년 전 심포니는 외부에서 대안을 모색하기 시작했다. 즉, 이미 머신러닝 모델 구축을 마치고 활용할 준비가 된 업체를 찾았다. 이제 심포니는 자체 데이터 저장소에 들어 있던 데이터를 데이터로봇(DataRobot)이라는 업체의 클라우드 기반 AI 엔진을 통해 전송한다. 데이터 처리 결과는 4시간에 한번씩 심포니의 마이크로소프트 파워BI 대시보드로 전달된다. 테일러는 “즉각적으로 나와 CIO가 이해했고 깊은 인상을 받았다”면서 “마치 마술 같았다”고 회상했다.

현재 240명의 의사와 간호사들은 태블릿과 스마트폰으로 접속할 수 있는 파워BI 대시보드에서 직접 예측과 추천을 받고 있다. 예를 들면, 낙상 위험이 높은 환자는 자동으로 계단 아이콘이 표시되고 재입원의 위험이 높은 환자들은 구급차 아이콘이 표시되는 식이다.
 


BI에 AI 주입
테일러에 따르면, 재입원 비율은 심포니에게 큰 문제였다. 병원과 보험회사는 재입원 비율을 검토했다. 재입원 1건당 회사는 미화 1만 3,500달러를 부담하게 된다. 테일러는 “무시할 수 없는 액수”라고 지적했다.

데이터로봇의 예측이 유용했는지를 알아내기 위해서 심포니는 데이터로봇 피드를 자체 시설 중 일부에서 활용하면서 6개월간 재입원 비율에 차이가 있었는지 조사했다. “1%라도 움직일 수 있다면 아주 잘하고 있는 것”으로 간주했다.

실제로 비율은 21%에서 18.8%로 낮아졌으며 “이는 의미 있는 수치였기 때문에 CEO를 설득할 수 있었다”고 그는 전했다.

오늘날 심포니는 보험회사와의 계약을 검토할 때도 똑같은 접근법을 적용하고 있다. 테일러는 “서비스에 대해 제대로 비용을 청구하지 않는다면 돈을 버리는 것이나 마찬가지기 때문”이라고 설명했다.

최초의 설치에는 약 20시간이 걸렸다. 데이터 피드를 연결하고 학습 모델을 설정하는 작업이 필요했다. 이제 새로운 종류의 예측을 원할 경우 평일 기준 사흘에 걸쳐 6시간 내지 8시간이면 새로운 학습 모델을 설정할 수 있다고 한다.

또한 기존 모델도 언제든지 재훈련이 가능하다고 한다. 예를 들면 규정이 바뀌거나 의료진이 새로운 수술을 시작하기도 하고 시간이 지나면서 모델이 표류하기도 한다. 테일러는 3개월에 한번씩, 또는 중대한 정책 변경이 있을 때마다 모델을 재훈련 시킨다. 큰 변화가 있으면 새로운 정책이 발효된 이후에 들어온 데이터만을 기준으로 학습 모델을 훈련해야 한다.

시스템 관리에는 이제 더 이상 고도로 훈련된 데이터 과학자가 필요 없지만 기본적인 통계 지식을 갖춘 사람이 필요하다고 한다. 심포니에서는 R 코드도 사용해서 모델을 설정한다.

데이터로봇은 또한 파이썬도 즉각 지원한다. 데이터로봇의 제품 마케팅 책임자 콜린 프리스트에 따르면 자바, C#, SAS, 자바스크립트, 비주얼 베이직 등 다른 언어를 사용하는 고객들도 레스트(Rest) API 인식 언어를 사용해 데이터로봇 레스트 API를 호출할 수 있다.
  
2018.04.20

'AI가 BI를 만났을 때' 더 똑똑해지고 유용해진다

Maria Korolov | CIO

데이터 과학이 대중화되고 있다. 데이터 과학자들이 데이터를 취합하고 분석하기까지 몇 달이 걸렸지만, 이제는 현업 사용자가 신속하게 데이터를 며칠 안에 모을 수 있게 됐다.



머신러닝이 약속하는 데이터 분석을 활용에서 의외의 기술이 등장한다. 바로 비즈니스 인텔리전스(BI)다. 성과 분석 영역이었던 BI 시스템을 인공지능으로 재단장하여 기존의 보고 기능에 예측 기능까지 결합하려는 것이다.

이러한 시도를 하는 조직 중 하나가 심포니 포스트 어큐트 네트워크(Symphony Post Acute Network)다. 미국 일리노이, 인디애나, 위스콘신주 28개 의료시설에 5,000개의 침상을 보유한 의료회사인 심포니는 무릎 수술 등에서 회복 중이거나 투석 치료를 받는 연 8만 명의 환자에 대한 간호를 개선하고자 인공지능과 머신러닝을 활용하고자 했다. 예를 들면, 어떤 환자는 특히 낙상 위험이 있으므로 주의를 더욱 기울여야 한다는 점을 찾아낼 수도 있기 때문이다.

개별적인 데이터 포인트나 미묘한 데이터 패턴으로 나타날 수 있는 이러한 지표를 찾아내는 것이야말로 머신러닝의 완벽한 활용 사례다. 그러나 모델 구축 작업은 간단하지 않다.

심포니의 데이터 과학 및 분석 책임자 네이선 패트릭 테일러는 “예측에 관해 질문 공세를 받았다”고 밝혔다. “온종일 머신러닝 모델 구축에 매달린다고 해도 그 모든 것을 혼자 다 해내는 것은 불가능하다”고 덧붙였다.

심포니는 2명의 데이터 과학자를 추가로 채용했다. 테일러는 “이들의 몸값이 비싸다. 그런데 우리가 필요로 한 결과를 얻지 못하고 있었다. 매우 어렵고 비용이 많이 드는 일이었다”고 말했다.

그래서 2년 전 심포니는 외부에서 대안을 모색하기 시작했다. 즉, 이미 머신러닝 모델 구축을 마치고 활용할 준비가 된 업체를 찾았다. 이제 심포니는 자체 데이터 저장소에 들어 있던 데이터를 데이터로봇(DataRobot)이라는 업체의 클라우드 기반 AI 엔진을 통해 전송한다. 데이터 처리 결과는 4시간에 한번씩 심포니의 마이크로소프트 파워BI 대시보드로 전달된다. 테일러는 “즉각적으로 나와 CIO가 이해했고 깊은 인상을 받았다”면서 “마치 마술 같았다”고 회상했다.

현재 240명의 의사와 간호사들은 태블릿과 스마트폰으로 접속할 수 있는 파워BI 대시보드에서 직접 예측과 추천을 받고 있다. 예를 들면, 낙상 위험이 높은 환자는 자동으로 계단 아이콘이 표시되고 재입원의 위험이 높은 환자들은 구급차 아이콘이 표시되는 식이다.
 


BI에 AI 주입
테일러에 따르면, 재입원 비율은 심포니에게 큰 문제였다. 병원과 보험회사는 재입원 비율을 검토했다. 재입원 1건당 회사는 미화 1만 3,500달러를 부담하게 된다. 테일러는 “무시할 수 없는 액수”라고 지적했다.

데이터로봇의 예측이 유용했는지를 알아내기 위해서 심포니는 데이터로봇 피드를 자체 시설 중 일부에서 활용하면서 6개월간 재입원 비율에 차이가 있었는지 조사했다. “1%라도 움직일 수 있다면 아주 잘하고 있는 것”으로 간주했다.

실제로 비율은 21%에서 18.8%로 낮아졌으며 “이는 의미 있는 수치였기 때문에 CEO를 설득할 수 있었다”고 그는 전했다.

오늘날 심포니는 보험회사와의 계약을 검토할 때도 똑같은 접근법을 적용하고 있다. 테일러는 “서비스에 대해 제대로 비용을 청구하지 않는다면 돈을 버리는 것이나 마찬가지기 때문”이라고 설명했다.

최초의 설치에는 약 20시간이 걸렸다. 데이터 피드를 연결하고 학습 모델을 설정하는 작업이 필요했다. 이제 새로운 종류의 예측을 원할 경우 평일 기준 사흘에 걸쳐 6시간 내지 8시간이면 새로운 학습 모델을 설정할 수 있다고 한다.

또한 기존 모델도 언제든지 재훈련이 가능하다고 한다. 예를 들면 규정이 바뀌거나 의료진이 새로운 수술을 시작하기도 하고 시간이 지나면서 모델이 표류하기도 한다. 테일러는 3개월에 한번씩, 또는 중대한 정책 변경이 있을 때마다 모델을 재훈련 시킨다. 큰 변화가 있으면 새로운 정책이 발효된 이후에 들어온 데이터만을 기준으로 학습 모델을 훈련해야 한다.

시스템 관리에는 이제 더 이상 고도로 훈련된 데이터 과학자가 필요 없지만 기본적인 통계 지식을 갖춘 사람이 필요하다고 한다. 심포니에서는 R 코드도 사용해서 모델을 설정한다.

데이터로봇은 또한 파이썬도 즉각 지원한다. 데이터로봇의 제품 마케팅 책임자 콜린 프리스트에 따르면 자바, C#, SAS, 자바스크립트, 비주얼 베이직 등 다른 언어를 사용하는 고객들도 레스트(Rest) API 인식 언어를 사용해 데이터로봇 레스트 API를 호출할 수 있다.
  
X