2020.05.29

블로그 | 애플의 잇단 AI 스타트업 인수로 본 제품 전략

Jonny Evans | Computerworld
애플이 데이터와 AI에 관련된 해묵은 문제를 해결하고자 한다. '잘못된 데이터가 들어가면 잘못된 결과가 나온다(junk in, junk out)'라는 문제다. 

데이터의 문제점은 ‘양이 너무나도 방대하다’라는 것이다. IDG에 따르면 전 세계의 모든 데이터를 DVD에 저장하면 지구 둘레를 222바퀴 돌 만큼의 디스크 더미가 나온다. 그렇다면 어떻게 ‘정크(Junk)’ 데이터를 걸러낼 수 있을까? 바로 애플이 해결하고자 하는 문제다. 

 
ⓒApple

애플은 캐나다 온타리오 소재의 소규모 머신러닝 스타트업 인덕티브(Inductiv)를 인수했다고 밝혔다. 이 회사는 “수시로 작은 기술 기업들을 인수하고 있다”라고 통상적인 성명을 발표했을 뿐 구체적인 목적이나 계획은 공개하지 않았다. 

인덕티브는 규모가 작고 현재까지 괄목한 만한 성과를 보여주진 않았다. 중요한 것은 이 스타트업이 매우 유능한 인재들, 이를테면 스탠퍼드, 워털루, 위스콘신 대학교의 AI 전문가들로 구성돼 있다는 점이다(현재 대부분이 애플에서 근무하고 있는 것으로 보인다). 

필자는 애플이 다양한 목적으로 AI 스타트업을 잇달아 사들이는 행보를 지켜봤다. 이번 인수는 애플이 자사 시스템 전반에 걸쳐 머신러닝을 최적화하려는 목적에 해당될 가능성이 높다. 

AI의 가장 큰 문제점은 핵심 요소인 데이터에 있다. 즉 고품질의 데이터를 확보하는 것, 그리고 활용 가치가 높은 데이터를 추출 및 정제하는 것이 가장 큰 과제다. 머신러닝 및 인공지능 분야의 진리 중 하나는 다음과 같다. '정크 인, 정크 아웃(Junk in, junk out)', 즉 잘못된 데이터 혹은 제대로 분석되지 않은 데이터는 잘못된 결과를 낳는다는 것이다.

“시리야(Hey Siri), 네가 알고 있는 걸 말해봐”
우리가 흔히 시리에게 하는 말이다. 하지만 이렇게 시리와 나눈 대화의 일부(의도치 않게 시리가 작동돼 녹음된 대화도 포함)가 녹음됐으며, 애플이 협력사 직원들을 동원해 이를 직접 청취해 왔다는 사실이 밝혀져 파장을 일으켰다. 

애플이 ‘그레이딩(grading)’이라고 부르는 이 프로세스는 시리와 사용자 간의 대화 일부를 듣고 분석해 시스템을 개선하겠다는 목적이었다. 문제는 이 과정에서 개인들의 사적인 내용이 유출될 수도 있다는 것이다. 현재 애플은 사용자들에게 녹음 허용 여부를 선택할 수 있도록 하고 있지만 여전히 이 그레이딩 프로세스를 운영하고 있다. 

물론 동의 없이 사용자 데이터를 활용한 것은 비단 애플뿐만이 아니다. 그러나 애플은 개인정보 보호를 중시하는 정책을 강조해온 회사다. 당연히 사용자들은 반발했고 시리가 보관 중인 데이터를 관리할 수 있는 툴이 등장하기도 했다.

대화 감청을 좋아하는 사람은 없다. 그런데도 애플 및 다른 기업들은 시리에 사용되는 AI를 개선하기 위해서는 이러한 평가 프로세스가 필요하다고 주장하고 있다. 머신러닝 알고리즘이 어떤 잘못된 결과를 냈는지, 어떻게 그러한 결과를 만들어냈는지 파악하기 위해서는 원인을 분석할 필요가 있다는 것이다. 

중요한 것은 AI가 수집한 데이터를 처리할 때 또다시 AI가 필요하다는 점이다. 인덕티브가 개발한 것이 데이터세트에서 오류를 식별하고 수정하는 기술이다. 

이 기술이 정확히 그레이딩 프로세스를 대체하는 것은 아니다. 하지만 잘못된 결과를 도출하는 데이터를 식별한다는 점에서 직원들이 직접 듣고 평가해야 하는 데이터의 양을 줄이는 데 도움을 줄 수 있다. 

시리에만 한정되는 이야기는 아니다. 애플의 머신러닝 시스템이 자사의 제품 전반에 깊게 통합돼 있기 때문이다. 이는 멋진 사진을 찾거나 만들 수 있는 애플의 훌륭한 사진 툴만 봐도 알 수 있다. 

어떤 알고리즘이 일상을 윤택하게 해주는 반면에 다른 알고리즘은 어떤 데이터가 실제로 유용한지 혹은 그렇지 않은지를 파악하는 데 기여할 것이다. 어떻게 될지는 두고 봐야 할 일이다. 

* Jonny Evans는 1999년부터 애플과 기술에 대해 저술해온 전문 기고가다. ciokr@idg.co.kr



2020.05.29

블로그 | 애플의 잇단 AI 스타트업 인수로 본 제품 전략

Jonny Evans | Computerworld
애플이 데이터와 AI에 관련된 해묵은 문제를 해결하고자 한다. '잘못된 데이터가 들어가면 잘못된 결과가 나온다(junk in, junk out)'라는 문제다. 

데이터의 문제점은 ‘양이 너무나도 방대하다’라는 것이다. IDG에 따르면 전 세계의 모든 데이터를 DVD에 저장하면 지구 둘레를 222바퀴 돌 만큼의 디스크 더미가 나온다. 그렇다면 어떻게 ‘정크(Junk)’ 데이터를 걸러낼 수 있을까? 바로 애플이 해결하고자 하는 문제다. 

 
ⓒApple

애플은 캐나다 온타리오 소재의 소규모 머신러닝 스타트업 인덕티브(Inductiv)를 인수했다고 밝혔다. 이 회사는 “수시로 작은 기술 기업들을 인수하고 있다”라고 통상적인 성명을 발표했을 뿐 구체적인 목적이나 계획은 공개하지 않았다. 

인덕티브는 규모가 작고 현재까지 괄목한 만한 성과를 보여주진 않았다. 중요한 것은 이 스타트업이 매우 유능한 인재들, 이를테면 스탠퍼드, 워털루, 위스콘신 대학교의 AI 전문가들로 구성돼 있다는 점이다(현재 대부분이 애플에서 근무하고 있는 것으로 보인다). 

필자는 애플이 다양한 목적으로 AI 스타트업을 잇달아 사들이는 행보를 지켜봤다. 이번 인수는 애플이 자사 시스템 전반에 걸쳐 머신러닝을 최적화하려는 목적에 해당될 가능성이 높다. 

AI의 가장 큰 문제점은 핵심 요소인 데이터에 있다. 즉 고품질의 데이터를 확보하는 것, 그리고 활용 가치가 높은 데이터를 추출 및 정제하는 것이 가장 큰 과제다. 머신러닝 및 인공지능 분야의 진리 중 하나는 다음과 같다. '정크 인, 정크 아웃(Junk in, junk out)', 즉 잘못된 데이터 혹은 제대로 분석되지 않은 데이터는 잘못된 결과를 낳는다는 것이다.

“시리야(Hey Siri), 네가 알고 있는 걸 말해봐”
우리가 흔히 시리에게 하는 말이다. 하지만 이렇게 시리와 나눈 대화의 일부(의도치 않게 시리가 작동돼 녹음된 대화도 포함)가 녹음됐으며, 애플이 협력사 직원들을 동원해 이를 직접 청취해 왔다는 사실이 밝혀져 파장을 일으켰다. 

애플이 ‘그레이딩(grading)’이라고 부르는 이 프로세스는 시리와 사용자 간의 대화 일부를 듣고 분석해 시스템을 개선하겠다는 목적이었다. 문제는 이 과정에서 개인들의 사적인 내용이 유출될 수도 있다는 것이다. 현재 애플은 사용자들에게 녹음 허용 여부를 선택할 수 있도록 하고 있지만 여전히 이 그레이딩 프로세스를 운영하고 있다. 

물론 동의 없이 사용자 데이터를 활용한 것은 비단 애플뿐만이 아니다. 그러나 애플은 개인정보 보호를 중시하는 정책을 강조해온 회사다. 당연히 사용자들은 반발했고 시리가 보관 중인 데이터를 관리할 수 있는 툴이 등장하기도 했다.

대화 감청을 좋아하는 사람은 없다. 그런데도 애플 및 다른 기업들은 시리에 사용되는 AI를 개선하기 위해서는 이러한 평가 프로세스가 필요하다고 주장하고 있다. 머신러닝 알고리즘이 어떤 잘못된 결과를 냈는지, 어떻게 그러한 결과를 만들어냈는지 파악하기 위해서는 원인을 분석할 필요가 있다는 것이다. 

중요한 것은 AI가 수집한 데이터를 처리할 때 또다시 AI가 필요하다는 점이다. 인덕티브가 개발한 것이 데이터세트에서 오류를 식별하고 수정하는 기술이다. 

이 기술이 정확히 그레이딩 프로세스를 대체하는 것은 아니다. 하지만 잘못된 결과를 도출하는 데이터를 식별한다는 점에서 직원들이 직접 듣고 평가해야 하는 데이터의 양을 줄이는 데 도움을 줄 수 있다. 

시리에만 한정되는 이야기는 아니다. 애플의 머신러닝 시스템이 자사의 제품 전반에 깊게 통합돼 있기 때문이다. 이는 멋진 사진을 찾거나 만들 수 있는 애플의 훌륭한 사진 툴만 봐도 알 수 있다. 

어떤 알고리즘이 일상을 윤택하게 해주는 반면에 다른 알고리즘은 어떤 데이터가 실제로 유용한지 혹은 그렇지 않은지를 파악하는 데 기여할 것이다. 어떻게 될지는 두고 봐야 할 일이다. 

* Jonny Evans는 1999년부터 애플과 기술에 대해 저술해온 전문 기고가다. ciokr@idg.co.kr

X