마이크로소프트의 머신러닝 프레임워크 'ML 닷넷(ML.Net)'은 일반적인 머신러닝 작업을 크로스 플랫폼, 오픈소스 시스템에서 실행하려는 닷넷 개발자를 위한 것이다. 최근 새로 공개된 베타 0.4 버전은 깃허브에서 다운로드해 바로 사용해 볼 수 있다.
ML 닷넷은 지난 5월에 처음 발표됐다. 이를 이용하면 닷넷 개발자가 특정 작업용 모델을 만들어 닷넷 애플리케이션에서 사용할 수 있다. 모델 트레이닝과 예측을 위한 고수준 API를 활용하는 방식이다.
ML 닷넷의 첫 릴리즈는 기본적인 머신러닝 작업 2개와 분류(Classification), 회귀(regression)만 지원했다. 분류는 데이터를 범주화하는 데 사용한다. 스팸과 정상적인 메일을 나누거나 정서 분석을 하는 것이 대표적이다. 회귀는 가격 추이 등 숫자 데이터를 기반으로 예측 작업을 할 때 필요하다. 깃허브(GitHub) 리포에 이와 관련된 예제 애플리케이션과 훈련용 데이터가 있으니 참고하면 된다.
이번에 새로 발표된 ML 닷넷 0.4 버전은 기존 기능 외에 자연어 처리 같은 다른 작업을 추가로 지원한다. 그동안 마이크로소프트는 ML 닷넷 지원 작업을 늘리기 위해 노력해 왔다. 이 중 일부는 프레임워크에서 직접 지원하고 나머지는 ML 닷넷의 고수준 API를 활용한다. 이 API를 이용하면 구글 텐서플로우(TensorFlow)나 마이크로소프트 CNTK('코그니티브 툴킷(Cognitive Toolkit)'으로도 알려져 있다) 같은 기존 프레임워크를 사용할 수 있다.
버전 1.0 릴리즈로 나아가는 또다른 장기 계획을 보면, 마이크로소프트가 '파이프라인' API라고 부르는 것을 폐기하고 다른 사용하기 쉬운 API로 대체하는 것이 있다.
그러나 이러한 변화는 단순히 사용성을 개선하기 위한 것 이상이다. ML 닷넷은 설계부터 크로스플랫폼을 지향해, 이미 윈도우(서버와 데스트톱 포함)와 리눅스, 맥OS, 닷넷 코어 2 등을 지원한다. 이는 ML 닷넷 개발 작업이 마무리되지 않았다고 해도 닷넷 언어군의 모든 기능을 지원할 수 있음을 의미한다. 실제로 0.4 버전에서는 F# 레코드와 일부 C# 기능에 대한 지원이 개선됐다. ciokr@idg.co.kr