2018.09.10

그때그때 달라요··· 머신러닝 기법·기술 따라잡기

Bob Violino | InfoWorld

아마도 인공지능(AI)의 부분집합인 머신러닝(ML)에 대한 이야기를 갈수록 많이 듣고 있을 것이다. 그렇다면 ‘머신러닝’으로 정확히 무슨 일을 할 수 있을까?

머신러닝은 다양한 방식과 기법을 아우르고, 각각은 잠재적 이용 사례를 가지고 있다. 머신러닝 툴과 인프라에 대한 투자에 다짜고짜 뛰어들기 전에 이들을 먼저 조사하는 것이 바람직하다.

-> '말장난에 속지말자!'··· 헛소리 인공지능· 머신러닝 구별법

- 머신러닝 기법(Methods)

지도 학습(Supervised learning)
머신이 학습해야 하는 것을 이용자가 파악하고 있다면 지도 학습이 이상적이다. 엄청난 양의 훈련 데이터에 머신을 노출시키고, 결과를 조사하고, 기대한 결과를 얻을 때까지 매개변수를 조정할 수 있다. 그 후, 머신이 이전에 본 적이 없는 일련의 검증 데이터에 대해 결과를 예측하도록 함으로써 머신이 무엇을 배웠는지 알 수 있다.

가장 일반적인 지도 학습 작업은 분류와 예측을 포함하고, 또는 회귀(regression)를 포함한다.

지도 학습 기법은 과거의 재무 실적에 대한 정보에 기초해 개인 및 조직의 재무 위험을 결정하는 등의 용도에 쓰일 수 있다. 아울러 과거의 행동 패턴에 기초해 고객이 어떻게 행동할 것인지, 또는 이들의 선호사항이 무엇인지에 관한 양질의 의견 역시 제공할 수 있다.

예를 들어, 온라인 대출 사이트인 렌딩 트리(Lending Tree)는 데이터로봇(DataRobot)의 자동 머신러닝 플랫폼을 이용하여 고객에 대한 경험을 커스터마이징하고, 고객의 과거 행적을 기초로 고객의 의도를 예측한다고, 액크셰이 탠던(Akshay Tandon) 부사장 겸 전략/애널리틱스 책임자는 말했다.

고객의 의도를 예측함으로써 – 주로 ‘리드 스코어링(lead scoring)’을 통해 – 렌딩 트리는 이자율을 단순히 둘러보는 사람과 실제로 대출을 신청할 용의가 있는 사람을 높은 확률로 구분한다. 지도 학습 기법을 이용하여, 회사는 거래 성사의 확률을 정의하는 분류 모델을 구축했다.

비지도 학습(unsupervised learning)
비지도 학습은 머신이 데이터 세트를 탐색하여 상이한 변수들을 연결하는 감추어진 패턴을 규명하는데 활용된다. 데이터를 통계적 특성들에만 기초해 클러스터링 하는데 이용되곤 한다.

비지도 학습의 좋은 응용 분야는 개연적 기록 연결을 수행하는데 쓰이는 클러스터링 알고리즘이다. 이는 데이터 요소들 간의 접점을 추출하고, 이를 바탕으로 개인 및 조직을 식별하고 물리 및 가상 세계에서 이들의 접점을 규명한다.

이는 이질적 출처로부터 또는 상이한 사업 부문에 걸쳐 데이터를 통합하여 고객에 대한 일관되고 포괄적인 시각을 구축하는데 특히 유용하다고 렉시스넥시스 리스크 솔루션즈(LexisNexis Risk Solutions)의 기술 부사장 플래비오 빌래누스터는 설명했다. 이 회사는 애널리틱스를 이용해 고객이 위험을 예측하고 관리하는데 도움을 준다.

비지도 학습은 정서 분석(sentiment analysis)에 이용될 수 있다. 이는 개인의 소셜 미디어 게시물, 이메일, 여타 서면 반응을 바탕으로 개인의 정서 상태를 규명한다고 컨설팅 회사인 캠브리지 컨설턴트(Cambridge Consultants)의 특수 머신러닝 엔지니어인 샐리 엡스타인은 전했다. 그녀에 따르면 비지도 학습을 통해 통찰력을 추출하여 고객을 만족시키는 금융서비스 회사가 늘어나는 추세다.

준지도 학습(semisupervised learning)
준지도 학습은 지도 및 비지도 학습을 혼합한다. 감독자는 데이터의 작은 부분에 라벨을 붙여 기계에게 데이터 집합의 나머지를 어떻게 분류할 것인지에 대한 단서를 주는 방식이다.

준지도 학습은, 무엇보다, 신분 사기를 검출하는데 사용될 수 있다. 빌랜누스터에 따르면 사기는 비-사기 활동만큼 빈번하지 않고, 따라서 사기 행위는 적법 행위 세계에 있는 ‘예외(anomaly)’로 간주될 수 있다. 그래도 사기는 존재하는데, 준지도 예외 검출 머신러닝 기법이 이런 문제 유형에 대한 솔루션을 모델링 하는데 사용될 수 있다.

준지도 학습은 라벨 처리된 것과 라벨 처리되지 않은 데이터가 혼재할 때에도 사용될 수 있고, 이는 대기업 환경에서 빈번하게 목격된다고 엡스타인을 전했다. 또 아마존은 라벨 및 비라벨 데이터에 관해 AI 알고리즘을 훈련시킴으로써 알렉사(Alexa)의 자연어 이해를 강화할 수 있었다고 그는 설명하며, 이는 알렉사의 반응의 정확도를 높이는데 유용했다고 덧붙였다.

강화 학습(reinforcement learning)
강화 학습에 의해 기계는 환경과 상호작용할 수 있다(예컨대 하자 제품을 컨베이어에서 휴지통으로 밀어내는 것). 아울러 이용자가 원하는 것을 한 경우 보상을 제공한다. 보상 계산을 자동화함으로써 기계가 스스로 학습할 시간을 준다.

강화 학습의 사용 사례 중 하나로는 소매 매장에서 의류 및 여타 물품의 분류를 들 수 있다. 일부 의류 소매업체는 의류, 신발 및 액세서리 같은 물품을 분류하는데 로봇 공학 등의 새로운 기술을 시험하고 있다고 신생 기술 및 비즈니스 동향에 집중하는 컨설팅 회사인 딜로이트의 애널리스트 데이비드 채스키는 말했다.

채스키는 로봇이 강화 학습을 이용하여 (또 딥 러닝을 이용하여) 물품을 잡을 때 어느 정도의 압력을 사용해야 하는 지를, 그리고 물품목록 안에서 이들을 가장 적절하게 잡는 법을 파악한다고 설명했다.

강화 학습의 한 변형은 딥 강화 학습(deep reinforcement learning)이다. 이 기법은 지도 학습 또는 비지도 학습 기법만으로 작업을 완수할 수 없을 때 자율적 의사 결정을 내리도록 하는데 아주 적합하다.

딥러닝(deep learning)
딥러닝은 비지도 또는 강화 학습 등의 학습 유형을 수행한다. 개략적으로, 딥러닝은 주로 신경망을 이용하여 데이터 세트의 특징들을 상세히 식별함으로써 사람의 일부 학습 방법을 모방한다.

-> 알아두면 쓸데있는 '딥러닝 이야기'

딥러닝은 딥 신경망(Deep Neural Network, DNN) 형태로 신약 개발에서 고효율 스크리닝을 가속하는데 이용되어 왔다고 채스키는 전했다. 이는 딥 신경망(DNN) 가속 기법을 적용해 현저히 적은 시간에 다수의 이미지를 처리한다. 그러면서 딥 러닝 모델이 궁극적으로 학습한 이미지 특징들로부터 더욱 양질의 통찰력을 추출한다.

아울러 이 머신러닝 기법은 수많은 회사들이 사기에 대처할 수 있도록 해준다. 자동화된 범죄 행위 검출을 이용해 검출률을 제고하는 방식이다.

또한 딥러닝은 자동차 산업에도 쓰일 수 있다. 한 회사는 자동차의 문제를 조기에 검출하는 신경망 기반 시스템을 개발했다고 채스키는 전했다. 이 시스템은 소음과 진동을 인식할 수 있고, 표준으로부터의 편차를 이용해 장애의 성질을 해석한다. 이는 예측 정비의 일부가 될 수 있다. 왜냐하면 자동차 동작 부품의 진동을 판정하여 성능의 미세한 변화까지 인지할 수 있기 때문이다.



- 머신러닝 기술(Techniques)

신경망 (neural networks)
신경망은 인간 두뇌의 신경 체계를 모방해 설계됐다. 각 인공 뉴런은 시스템 내부에서 다른 뉴런과 연결된다. 신경망은 계층들로 배열되어, 한 계층의 뉴런이 다음 계층의 다수 뉴런에게 데이터를 전달한다. 궁극적으로 데이터는 출력 계층에 도달하고, 여기서 신경망은 문제 해결, 객체 식별 등을 위한 최선의 추측을 내놓는다.

신경망 사용 사례는 여러 산업에 걸쳐 나타난다.

- 생명과학 및 의료에서, 진단 프로세스를 가속하기 위해 의학 이미지를 분석하는데, 그리고 신약 개발에 사용될 수 있다.

- 통신 및 미디어에서, 신경망은 언어 번역, 사기 검출, 가상 비서 서비스를 위해 사용될 수 있다.

- 금융 서비스에서, 이들은 사기 검출, 자산 운영, 위험 분석에 사용될 수 있다.

- 소매에서, 이들은 계산대 줄을 없애고, 고객 경험을 개인화하는데 사용될 수 있다.


2018.09.10

그때그때 달라요··· 머신러닝 기법·기술 따라잡기

Bob Violino | InfoWorld

아마도 인공지능(AI)의 부분집합인 머신러닝(ML)에 대한 이야기를 갈수록 많이 듣고 있을 것이다. 그렇다면 ‘머신러닝’으로 정확히 무슨 일을 할 수 있을까?

머신러닝은 다양한 방식과 기법을 아우르고, 각각은 잠재적 이용 사례를 가지고 있다. 머신러닝 툴과 인프라에 대한 투자에 다짜고짜 뛰어들기 전에 이들을 먼저 조사하는 것이 바람직하다.

-> '말장난에 속지말자!'··· 헛소리 인공지능· 머신러닝 구별법

- 머신러닝 기법(Methods)

지도 학습(Supervised learning)
머신이 학습해야 하는 것을 이용자가 파악하고 있다면 지도 학습이 이상적이다. 엄청난 양의 훈련 데이터에 머신을 노출시키고, 결과를 조사하고, 기대한 결과를 얻을 때까지 매개변수를 조정할 수 있다. 그 후, 머신이 이전에 본 적이 없는 일련의 검증 데이터에 대해 결과를 예측하도록 함으로써 머신이 무엇을 배웠는지 알 수 있다.

가장 일반적인 지도 학습 작업은 분류와 예측을 포함하고, 또는 회귀(regression)를 포함한다.

지도 학습 기법은 과거의 재무 실적에 대한 정보에 기초해 개인 및 조직의 재무 위험을 결정하는 등의 용도에 쓰일 수 있다. 아울러 과거의 행동 패턴에 기초해 고객이 어떻게 행동할 것인지, 또는 이들의 선호사항이 무엇인지에 관한 양질의 의견 역시 제공할 수 있다.

예를 들어, 온라인 대출 사이트인 렌딩 트리(Lending Tree)는 데이터로봇(DataRobot)의 자동 머신러닝 플랫폼을 이용하여 고객에 대한 경험을 커스터마이징하고, 고객의 과거 행적을 기초로 고객의 의도를 예측한다고, 액크셰이 탠던(Akshay Tandon) 부사장 겸 전략/애널리틱스 책임자는 말했다.

고객의 의도를 예측함으로써 – 주로 ‘리드 스코어링(lead scoring)’을 통해 – 렌딩 트리는 이자율을 단순히 둘러보는 사람과 실제로 대출을 신청할 용의가 있는 사람을 높은 확률로 구분한다. 지도 학습 기법을 이용하여, 회사는 거래 성사의 확률을 정의하는 분류 모델을 구축했다.

비지도 학습(unsupervised learning)
비지도 학습은 머신이 데이터 세트를 탐색하여 상이한 변수들을 연결하는 감추어진 패턴을 규명하는데 활용된다. 데이터를 통계적 특성들에만 기초해 클러스터링 하는데 이용되곤 한다.

비지도 학습의 좋은 응용 분야는 개연적 기록 연결을 수행하는데 쓰이는 클러스터링 알고리즘이다. 이는 데이터 요소들 간의 접점을 추출하고, 이를 바탕으로 개인 및 조직을 식별하고 물리 및 가상 세계에서 이들의 접점을 규명한다.

이는 이질적 출처로부터 또는 상이한 사업 부문에 걸쳐 데이터를 통합하여 고객에 대한 일관되고 포괄적인 시각을 구축하는데 특히 유용하다고 렉시스넥시스 리스크 솔루션즈(LexisNexis Risk Solutions)의 기술 부사장 플래비오 빌래누스터는 설명했다. 이 회사는 애널리틱스를 이용해 고객이 위험을 예측하고 관리하는데 도움을 준다.

비지도 학습은 정서 분석(sentiment analysis)에 이용될 수 있다. 이는 개인의 소셜 미디어 게시물, 이메일, 여타 서면 반응을 바탕으로 개인의 정서 상태를 규명한다고 컨설팅 회사인 캠브리지 컨설턴트(Cambridge Consultants)의 특수 머신러닝 엔지니어인 샐리 엡스타인은 전했다. 그녀에 따르면 비지도 학습을 통해 통찰력을 추출하여 고객을 만족시키는 금융서비스 회사가 늘어나는 추세다.

준지도 학습(semisupervised learning)
준지도 학습은 지도 및 비지도 학습을 혼합한다. 감독자는 데이터의 작은 부분에 라벨을 붙여 기계에게 데이터 집합의 나머지를 어떻게 분류할 것인지에 대한 단서를 주는 방식이다.

준지도 학습은, 무엇보다, 신분 사기를 검출하는데 사용될 수 있다. 빌랜누스터에 따르면 사기는 비-사기 활동만큼 빈번하지 않고, 따라서 사기 행위는 적법 행위 세계에 있는 ‘예외(anomaly)’로 간주될 수 있다. 그래도 사기는 존재하는데, 준지도 예외 검출 머신러닝 기법이 이런 문제 유형에 대한 솔루션을 모델링 하는데 사용될 수 있다.

준지도 학습은 라벨 처리된 것과 라벨 처리되지 않은 데이터가 혼재할 때에도 사용될 수 있고, 이는 대기업 환경에서 빈번하게 목격된다고 엡스타인을 전했다. 또 아마존은 라벨 및 비라벨 데이터에 관해 AI 알고리즘을 훈련시킴으로써 알렉사(Alexa)의 자연어 이해를 강화할 수 있었다고 그는 설명하며, 이는 알렉사의 반응의 정확도를 높이는데 유용했다고 덧붙였다.

강화 학습(reinforcement learning)
강화 학습에 의해 기계는 환경과 상호작용할 수 있다(예컨대 하자 제품을 컨베이어에서 휴지통으로 밀어내는 것). 아울러 이용자가 원하는 것을 한 경우 보상을 제공한다. 보상 계산을 자동화함으로써 기계가 스스로 학습할 시간을 준다.

강화 학습의 사용 사례 중 하나로는 소매 매장에서 의류 및 여타 물품의 분류를 들 수 있다. 일부 의류 소매업체는 의류, 신발 및 액세서리 같은 물품을 분류하는데 로봇 공학 등의 새로운 기술을 시험하고 있다고 신생 기술 및 비즈니스 동향에 집중하는 컨설팅 회사인 딜로이트의 애널리스트 데이비드 채스키는 말했다.

채스키는 로봇이 강화 학습을 이용하여 (또 딥 러닝을 이용하여) 물품을 잡을 때 어느 정도의 압력을 사용해야 하는 지를, 그리고 물품목록 안에서 이들을 가장 적절하게 잡는 법을 파악한다고 설명했다.

강화 학습의 한 변형은 딥 강화 학습(deep reinforcement learning)이다. 이 기법은 지도 학습 또는 비지도 학습 기법만으로 작업을 완수할 수 없을 때 자율적 의사 결정을 내리도록 하는데 아주 적합하다.

딥러닝(deep learning)
딥러닝은 비지도 또는 강화 학습 등의 학습 유형을 수행한다. 개략적으로, 딥러닝은 주로 신경망을 이용하여 데이터 세트의 특징들을 상세히 식별함으로써 사람의 일부 학습 방법을 모방한다.

-> 알아두면 쓸데있는 '딥러닝 이야기'

딥러닝은 딥 신경망(Deep Neural Network, DNN) 형태로 신약 개발에서 고효율 스크리닝을 가속하는데 이용되어 왔다고 채스키는 전했다. 이는 딥 신경망(DNN) 가속 기법을 적용해 현저히 적은 시간에 다수의 이미지를 처리한다. 그러면서 딥 러닝 모델이 궁극적으로 학습한 이미지 특징들로부터 더욱 양질의 통찰력을 추출한다.

아울러 이 머신러닝 기법은 수많은 회사들이 사기에 대처할 수 있도록 해준다. 자동화된 범죄 행위 검출을 이용해 검출률을 제고하는 방식이다.

또한 딥러닝은 자동차 산업에도 쓰일 수 있다. 한 회사는 자동차의 문제를 조기에 검출하는 신경망 기반 시스템을 개발했다고 채스키는 전했다. 이 시스템은 소음과 진동을 인식할 수 있고, 표준으로부터의 편차를 이용해 장애의 성질을 해석한다. 이는 예측 정비의 일부가 될 수 있다. 왜냐하면 자동차 동작 부품의 진동을 판정하여 성능의 미세한 변화까지 인지할 수 있기 때문이다.



- 머신러닝 기술(Techniques)

신경망 (neural networks)
신경망은 인간 두뇌의 신경 체계를 모방해 설계됐다. 각 인공 뉴런은 시스템 내부에서 다른 뉴런과 연결된다. 신경망은 계층들로 배열되어, 한 계층의 뉴런이 다음 계층의 다수 뉴런에게 데이터를 전달한다. 궁극적으로 데이터는 출력 계층에 도달하고, 여기서 신경망은 문제 해결, 객체 식별 등을 위한 최선의 추측을 내놓는다.

신경망 사용 사례는 여러 산업에 걸쳐 나타난다.

- 생명과학 및 의료에서, 진단 프로세스를 가속하기 위해 의학 이미지를 분석하는데, 그리고 신약 개발에 사용될 수 있다.

- 통신 및 미디어에서, 신경망은 언어 번역, 사기 검출, 가상 비서 서비스를 위해 사용될 수 있다.

- 금융 서비스에서, 이들은 사기 검출, 자산 운영, 위험 분석에 사용될 수 있다.

- 소매에서, 이들은 계산대 줄을 없애고, 고객 경험을 개인화하는데 사용될 수 있다.


X