Offcanvas

AI / How To / 로봇|자동화 / 머신러닝|딥러닝

그때그때 달라요··· 머신러닝 기법·기술 따라잡기

2018.09.10 Bob Violino  |  InfoWorld


결정 트리(decision tree algorithm)
결정 트리 알고리즘은 항목을 배치할 클래스를 결정하는데 유용한 항목 속성에 대한 질문들을 규명함으로써 항목을 분류하는 것을 목표로 한다. 트리 내의 각 노드(node)는 질문이고, 가지(branches)는 항목에 대한 더 많은 질문으로 이어지고, 잎(leaves)은 최종 분류에 해당한다.

결정 트리의 사용 사례로는 고객 서비스, 가격 예측, 제품 플래닝을 위한 지식 관리 플랫폼을 구축하는 것 등이 있다.

보험회사는 잠재 위험에 기초해 어떤 종류의 보험 상품 및 보험료 조정이 필요한지에 관한 통찰력이 필요할 때 결정 트리를 이용할 수 있다고 비즈니스 및 테크놀로지 컨설팅 회사인 SPR의 수석 데이터 과학자 레이 존슨은 전했다.

설명에 따르면 날씨 관련 손해 데이터와 위치 데이터를 중복시켜, 제출된 주장과 지출 금액을 기초로 위험 범주를 생성할 수 있다. 그 후 새로운 커버리지 적용을 모델과 대조해 평가하여 위험 범주와 잠재적 금융 영향을 제공할 수 있다.

랜덤 포레스트(random forest algorithm)
결정 트리는 정확한 결과를 제공하기 위해 훈련을 받아야만 한다. 그러나 랜덤 포레스트 알고리즘은 상이한 속성 세트를 기반으로 결정을 내리는 무작위로 생성된 결정 트리들을 취합하고, 이들이 가장 보편적인 클래스에 투표하도록 한다.

랜덤 포레스트는 데이터 세트에서 관계를 발견하기 위한 다용성 툴이고, 신속히 훈련시킬 수 있다고 엡스타인은 설명했다. 예를 들어, 원하지 않는 벌크 이메일은 이용자뿐 아니라, 서버의 로드 증가를 관리해야 하는 인터넷 서비스 공급자에게도 오랫동안 문젯거리였다. 이 문제에 대응해, 정상적인 이메일로부터 스팸을 걸러내는 자동화된 기법이 개발되었고, 이는 랜덤 포레스트를 이용해 원치 않는 이메일을 신속하고 정확하게 식별한다고 그는 말했다.

랜덤 포레스트의 다른 사용처는 환자 의료 기록을 분석해 질병을 식별하고, 금융 사기를 검출하고, 콜 센터 통화량을 예측하고, 특정 주식 매입에 따른 수익과 손실을 예측하는 것 등이다.

클러스터링(clustering algorithm)
클러스터링 알고리즘은 K-평균, 평균-이동, 기대 값-최대화(K-means, mean-shift, or expectation-maximization) 등의 기술을 이용하여 데이터 포인트들을 공유된 또는 유사한 특징에 따라 그룹핑 한다. 이는 분류 문제에 적용될 수 있는 비지도 학습 기법이다.

클러스터링 기법은 분획화 또는 범주화가 필요할 때 특히 유용하다고 채스키는 전했다. 활용되고 있는 사례로는 개별 특징에 따라 고객을 분획하여 마케팅 활동을 보다 효율적으로 배정하는 것, 특정 독자에게 뉴스 기사를 추천하는 것, 효과적인 법 집행 등이다.

클러스터링은 인간의 눈에 분명하지 않을 수 있는 복잡한 데이터 세트에서 그룹핑을 발견하는 데에도 유용하다. 엡스타인에 따르면, 실례는 데이터베이스 내 유사 문서를 분류하거나, 범죄 뉴스로부터 우범 지역을 규정하는 것 등이다.

연상 규칙 학습(association rule learning)
연상 규칙 학습은 변수들 사이의 관계를 찾는 추천 엔진에서 사용되는 비지도 기법이다. 이는 여러 전자상거래 사이트에서 ‘X를 구입하는 사람은 Y도 구입한다’는 제안의 배경이 되는 기법이기도 하다. 이 기법이 사용되는 실례를 찾기는 어렵지 않다.

구체적 사용 사례로는 판매고 증가를 원하는 특산품 소매업체일 수 있다고 존슨은 전했다. 기업는 이 기법을 이용해 고객의 구매 행동을 조사하여 행사, 스포츠 팀 등을 기념하는 특별 캔 및 번들 제품을 공급한다. 연상 규칙 기법은 고객이 언제 어디에서 선호하는 제품 조합을 구매하는지를 발견할 수 있는 통찰력을 제공한다.

과거의 구매 및 시간 프레임에 관한 정보를 이용해 회사는 보상 프로그램을 선제적으로 생성할 수 있고, 미래의 판매를 견인할 수 있는 특별 맞춤 오퍼를 제공할 수 있다고 존슨은 덧붙였다.

* Bob Violino는 컴퓨터월드, CIO, CSO, 인포월드, 네트워크월드에 기고하는 전문 저술가다.
ciokr@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.