2016.07.18

암 연구 돕는 '머신러닝+빅데이터'

Byron Connolly | CIO Australia
머신러닝이 다양한 여러 산업으로 보급되고 있다. 마케터는 타깃 고객의 행동양태 분석에, 도시 계획 기업은 더 나은 교통 체계 개발에, 의료 기관들은 질병 조기 진단에 각각 복잡한 데이터 알고리즘을 이용하고 있다.



워싱턴 대학(University of Washington) 컴퓨터공학과 '아마존(Amazon)' 머신러닝 교수인 카를로스 구에스틴은 5년 후에는 성공을 거둔 모든 앱의 중심에서 머신러닝이 활용될 것이라고 내다보고 있다.

그러나 1990년대부터 머신러닝을 연구한 미국의 제어 이론 전문가인 매스쿠말리 비다야사가에 따르면, 암 연구라는 복잡한 분야에서는 훨씬 더 어려우며, 더 큰 도전이 될 것이다.

그는 텍사스 대학(University of Texas)의 로열 소사이어티(Royal Society) 펠로우로 최근 멜버른 대학(University of Melbourne)이 주최한 '실제 세계의 생각하는 머신(Thinking Machines in the Physical World)' 컨퍼런스에 참석했다. 비다야사가는 컨퍼런스에서 머신러닝이 어떤 방법으로 암의 악성 종양 분자를 분석하는 데 도움을 주는지 설명했다.

그는 <CIO 오스트레일리아>와 가진 인터뷰에서, 데이터가 깨끗하지 않아 암 관련 문제에 머신러닝을 적용하기가 어렵다고 이야기했다.

그는 "생물학적 프로세스에는 '노이즈'가 많아, 측정한 것을 반복해 활용하기 어렵다. 다시 말해, 동일한 도구로 동일한 종양을 동일하게 측정하는 경우에도 날짜에 따라 다른 결과가 나올 수 있다"고 설명했다.

그는 공학 분야 등에서는 이런 문제가 발생하지 않는다고 말했다.

비다야사가는 "전압은 오늘 측정하든, 내일 측정하든 항상 측정값이 같다. 서로 다른 2개 회사의 전압계로 전압을 측정해도 동일한 값을 얻을 수 있다. 그런데 생물학은 다르다. 데이터에 노이즈가 아주 많다"고 설명했다.

비다야사가는 필요한 머신러닝 알고리즘을 새로 만드는 방법으로 이 문제에 접근하고 있다고 밝혔다.

예를 들어, 일부 알고리즘으로는 폐암 치료제의 효험을 예측했다. 또 임상의의 후속 치료 일정을 지원하기 위해 난소암 환자의 재발 시기를 판단하는 데 활용했다. 반면 여러 자궁암과 유방암 데이터 분석에 사용되는 알고리즘도 있다.


비다야사가에 따르면, 암 생물학 분야는 실시간으로 데이터를 분석해야 하는 전자상거래의 신용 카드 사기 행위 분석 등과 달리 데이터 처리 속도가 중요하지 않다.

그는 "암 관련 데이터 생성에 몇 년이 소요된다. 따라서 알고리즘의 속도는 큰 차이를 만들지 못한다"고 설명했다.

최근 암 연구 분야에서 머신러닝과 빅데이터 분석 기법 활용 사례가 증가하는 추세다.

지난 3월, 바이오기술 회사인 미트라(Mitra)는 머신러닝 알고리즘을 이용해 여러 다양한 환자들의 암 치료제 임상 반응 시간을 예측하는 연구 보고서를 발표했다.

미국의 몇몇 병원들은 소아암과 관련된 '비밀'을 밝히는데 빅데이터 분석 기술을 이용하고 있다.

비다야사가는 머신러닝 전문가와 의료진이 협력해야 하지만, 이런 사례가 극히 드물다고 지적하며 다음과 같이 말했다.

"의료 전문가는 이런 수학적 방법이 낯설다. 따라서 결과를 생산하는 머신러닝 알고리즘이 있어도, 이를 활용하기 꺼린다. 이들은 일선에 있는 사람들이기 때문에 위험 요소가 높다. 결론적인 연구 결과가 임상 치료에서 실제적인 영향을 가져오기까지 오랜 시간이 걸린다. 또는 우리가 통제할 수 없는 부분들 때문에 영향이 발생하지 않을 수도 있다. 우리는 이 문제를 생각해봐야 한다." ciokr@idg.co.kr
 

2016.07.18

암 연구 돕는 '머신러닝+빅데이터'

Byron Connolly | CIO Australia
머신러닝이 다양한 여러 산업으로 보급되고 있다. 마케터는 타깃 고객의 행동양태 분석에, 도시 계획 기업은 더 나은 교통 체계 개발에, 의료 기관들은 질병 조기 진단에 각각 복잡한 데이터 알고리즘을 이용하고 있다.



워싱턴 대학(University of Washington) 컴퓨터공학과 '아마존(Amazon)' 머신러닝 교수인 카를로스 구에스틴은 5년 후에는 성공을 거둔 모든 앱의 중심에서 머신러닝이 활용될 것이라고 내다보고 있다.

그러나 1990년대부터 머신러닝을 연구한 미국의 제어 이론 전문가인 매스쿠말리 비다야사가에 따르면, 암 연구라는 복잡한 분야에서는 훨씬 더 어려우며, 더 큰 도전이 될 것이다.

그는 텍사스 대학(University of Texas)의 로열 소사이어티(Royal Society) 펠로우로 최근 멜버른 대학(University of Melbourne)이 주최한 '실제 세계의 생각하는 머신(Thinking Machines in the Physical World)' 컨퍼런스에 참석했다. 비다야사가는 컨퍼런스에서 머신러닝이 어떤 방법으로 암의 악성 종양 분자를 분석하는 데 도움을 주는지 설명했다.

그는 <CIO 오스트레일리아>와 가진 인터뷰에서, 데이터가 깨끗하지 않아 암 관련 문제에 머신러닝을 적용하기가 어렵다고 이야기했다.

그는 "생물학적 프로세스에는 '노이즈'가 많아, 측정한 것을 반복해 활용하기 어렵다. 다시 말해, 동일한 도구로 동일한 종양을 동일하게 측정하는 경우에도 날짜에 따라 다른 결과가 나올 수 있다"고 설명했다.

그는 공학 분야 등에서는 이런 문제가 발생하지 않는다고 말했다.

비다야사가는 "전압은 오늘 측정하든, 내일 측정하든 항상 측정값이 같다. 서로 다른 2개 회사의 전압계로 전압을 측정해도 동일한 값을 얻을 수 있다. 그런데 생물학은 다르다. 데이터에 노이즈가 아주 많다"고 설명했다.

비다야사가는 필요한 머신러닝 알고리즘을 새로 만드는 방법으로 이 문제에 접근하고 있다고 밝혔다.

예를 들어, 일부 알고리즘으로는 폐암 치료제의 효험을 예측했다. 또 임상의의 후속 치료 일정을 지원하기 위해 난소암 환자의 재발 시기를 판단하는 데 활용했다. 반면 여러 자궁암과 유방암 데이터 분석에 사용되는 알고리즘도 있다.


비다야사가에 따르면, 암 생물학 분야는 실시간으로 데이터를 분석해야 하는 전자상거래의 신용 카드 사기 행위 분석 등과 달리 데이터 처리 속도가 중요하지 않다.

그는 "암 관련 데이터 생성에 몇 년이 소요된다. 따라서 알고리즘의 속도는 큰 차이를 만들지 못한다"고 설명했다.

최근 암 연구 분야에서 머신러닝과 빅데이터 분석 기법 활용 사례가 증가하는 추세다.

지난 3월, 바이오기술 회사인 미트라(Mitra)는 머신러닝 알고리즘을 이용해 여러 다양한 환자들의 암 치료제 임상 반응 시간을 예측하는 연구 보고서를 발표했다.

미국의 몇몇 병원들은 소아암과 관련된 '비밀'을 밝히는데 빅데이터 분석 기술을 이용하고 있다.

비다야사가는 머신러닝 전문가와 의료진이 협력해야 하지만, 이런 사례가 극히 드물다고 지적하며 다음과 같이 말했다.

"의료 전문가는 이런 수학적 방법이 낯설다. 따라서 결과를 생산하는 머신러닝 알고리즘이 있어도, 이를 활용하기 꺼린다. 이들은 일선에 있는 사람들이기 때문에 위험 요소가 높다. 결론적인 연구 결과가 임상 치료에서 실제적인 영향을 가져오기까지 오랜 시간이 걸린다. 또는 우리가 통제할 수 없는 부분들 때문에 영향이 발생하지 않을 수도 있다. 우리는 이 문제를 생각해봐야 한다." ciokr@idg.co.kr
 

X