2016.03.04

클라우드 머신러닝 서비스··· IBM-구글-MS-아마존의 차이점과 공통점

Serdar Yegulalp | InfoWorld
클라우드는 계속 높아져가는 기능과 특성의 기준을 충족해야 성과를 일궈낼 수 있다. 현재 모든 유명 클라우드 공급업체가 중점을 두고 있는 머신러닝(machine learning)도 여기에 포함된다.


Credit: Thinkstock

그러나 이 방식에는 차이가 있다. 일단 큐레이트 API(curated API)와 개방형 알고리듬 마켓플레이스(open-ended algorithm marketplace) 모델 간의 대립을 차치하고라도, '모든 것 이후 일부(everything and then some)'와 '딱 충분한 정도(just enough)'라는 모델이 있다. 다음은 4대 클라우드 공급업체인 IBM과 마이크로소프트, 구글, 아마존의 머신러닝 지향점을 비교한 내용이다.

IBM, 왓슨이라는 키를 잡고 배의 방향을 클라우드로 전환
IBM이 왓슨(Watson) 인공지능 시스템을 소비재 서비스로 바꾸겠다고 처음 발표했을 때, 많은 의문이 제기됐다. 어떤 형태를 갖게 될까? 어떤 식으로 소비될까? 그러나 가장 중요한 질문은 따로 있었다. '클라우드 분야의 거인으로 재탄생하려는 IBM의 노력에 얼마나 큰 힘이 될 것인가'라는 질문이었다.

2년 뒤, IBM은 블루믹스(Bluemix) PaaS 아래 여러 머신러닝 기반 서비스를 출시했다. 기상 예측, 언어 분석 시스템, 이미지 인식 시스템, 언어 번역, 감성 및 톤(tone) 분석을 예로 들 수 있다.

클라우드를 기반으로 머신 인텔리전스를 제공하는 기업 중에 가장 야심찬 기술 목록을 보유한 기업이 바로 IBM이다. 무엇보다 IBM은 '그림의 떡'과 같은 수준의 도구를 상대적으로 현실적인 도구를 통해 구현하려는 노력을 기울이고 있다. 주로 분석(analytics)과 리포팅(reporting)이 여기에 해당한다. IBM이 기상, 의료 등 여러 분야에서 전략적 인수를 다수 추진한 이면에는 왓슨을 성장시키기 위한 의도가 내포된 것으로 판단된다.

왓슨 서비스가 본격적으로 실용화될 수 있을 지 의문을 갖는 것은 어리석다. 때가 되면 그렇게 될 것이기 때문이다. 다만 IBM의 왓슨 서비스가 편안함을 느낄 수 있는 속도와 규모를 감당해낼 수 있을 지가 문제다. 대부분은 사용례를 찾기 위한 시간이 필요하다. 반면 입지가 튼튼한 스파크(Spark) 서비스와 AWS 람다(Lambda)를 닮은 서비스인 오픈위스크(OpenWhisk)는 즉시, 그리고 더 쉽게 수익화가 가능하다.

일부 기업과 조직은 창의적인 방법으로 왓슨의 분석 서비스를 구현하기 시작했다. IBM은 왓슨을 기반으로 한 사업을 연간 100억 달러 규모의 사업으로 키울 수 있다고 주장한다. 그러나 아직까지는 계속 추락하는 IBM의 매출을 상쇄시킬 정도의 성과를 일궈내지 못했다.

마이크로소프트, 당신을 위한, 당신에 의한 '구현'
IBM에게 왓슨이 있다면, 마이크로소프트는 머신 비전(machine vision), 음성 인식, 언어 분석을 포괄하는 고수준의 큐레이트 API 세트인 프로젝트 옥스포드(Project Oxford)가 있다.

API 리스트는 왓슨만큼 광범위하지 않다. 또한 하우올드넷(How-old.net)도 왓슨의 '제퍼디(Jeopardy!)'만큼 흥미롭지 않다. 그러나 마이크로소프트가 갖고 있는 의도는 유사하다. 머신러닝을 이용한 전용(proprietary) 큐레이트 API 세트다.

애저 머신러닝 스튜디오(Azure Machine Learning Studio)가 마이크로소프트의 머신러닝 목표에서 더 중요한 '절반'일 것이다. 이는 각자 데이터를 가져와 머신러닝 모델을 훈련시키고, REST 인터페이스를 통해 결과로 창출된 모델을 API로 재공유한다. IBM도 이와 유사한 블루믹스 기반의 예측 분석(Predictive Analytics) 서비스를 보유하고 있다. 그러나 마이크로소프트 스튜디오의 역사가 더 깊고, 더 폭넓은 용도를 갖고 있다.

IBM과 마이크로소프트 모두 2개의 각기 다른 머신러닝 서비스를 구현하고 있다. 큐레이트 데이터를 이용해 폐쇄적으로 동작을 조정하는 왓슨 API와 프로젝트와 옥스포드가 그 첫번째다. 두번째는 새로운 형태의 머신러닝 서비스를 구축, 공유, 더 나아가 수익화할 수 있는 플랫폼인 애저 머신러닝 스튜디오와 예측 분석이다.

마이크로소프트와 IBM의 가장 큰 차이점은 서비스가 아닌 '동기'이다. 마이크로소프트는 클라우드를 중심으로 미래를 대비하려 노력하고 있다. 그리고 게임 등 성공을 일궈낸 다른 비즈니스 부문이 이를 뒷받침하고 있다. 따라서 IBM과는 느끼는 압박감이 다르다. 그러나 이런 이유로 나아가야 할 방향을 인지하지 못하는 것은 아니다.

미니멀리스트인 아마존과 구글
구글, 특히 아마존의 클라우드를 설명하는 하나의 표현이 있다면, 그것은 '적을수록 좋다(less is more)'이다. 더 정확히 표현하면 '충분한 것이 좋다(just enough is more)'이다. 그리고 두 업체의 클라우드 기반 머신러닝 서비스에도 이 원칙이 동일하게 적용된다.

구글은 구글 클라우드 플랫폼(Google Cloud Platform)에서 단 2개의 서비스만 제공하고 있다. 구글의 기존 머신 번역 엔진을 지원하는 API인 구글 번역(Google Translate)과 구글 예측 API(Google Prediction API)다. 구글 번역은 구글이 독점적으로 운영하는 사유 API이며, 구글 예측 API는 마이크로소프트 애저 머신러닝 스튜디오와 같이 사용자가 데이터를 업로드, 모델을 훈련시키는 '포괄적'인 서비스다(데이터는 구글 빅쿼리(Google BigQuery)와 같은 구글 서비스에서 추출할 수 있다).

아마존 머신러닝(Amazon Machine Learning)은 데이터를 이용해 모델을 성장시키고, 이를 통해 예측을 한다는 점에서 구글 예측 API와 유사하다. 상대적으로 단순한 서비스다. 그 이유는 특정 문제 해결을 추구하는 개발자들을 끌어들일 의도이거나 시장 테스트에 목적이 있기 때문인 것으로 판단된다.

아마존과 구글 모두 니즈가 좁고, 이미 클라우드에 데이터를 저장하는 개발자가 대상이다. 즉 '딱 충분한' 모델이다. IBM과 마이크로소프트가 추구하는 대상은 이보다 넓다. 현재까지 제공할 것이 가장 많은 업체는 IBM이지만, 동시에 잃을 것도 가장 많다. editor@itworld.co.kr



2016.03.04

클라우드 머신러닝 서비스··· IBM-구글-MS-아마존의 차이점과 공통점

Serdar Yegulalp | InfoWorld
클라우드는 계속 높아져가는 기능과 특성의 기준을 충족해야 성과를 일궈낼 수 있다. 현재 모든 유명 클라우드 공급업체가 중점을 두고 있는 머신러닝(machine learning)도 여기에 포함된다.


Credit: Thinkstock

그러나 이 방식에는 차이가 있다. 일단 큐레이트 API(curated API)와 개방형 알고리듬 마켓플레이스(open-ended algorithm marketplace) 모델 간의 대립을 차치하고라도, '모든 것 이후 일부(everything and then some)'와 '딱 충분한 정도(just enough)'라는 모델이 있다. 다음은 4대 클라우드 공급업체인 IBM과 마이크로소프트, 구글, 아마존의 머신러닝 지향점을 비교한 내용이다.

IBM, 왓슨이라는 키를 잡고 배의 방향을 클라우드로 전환
IBM이 왓슨(Watson) 인공지능 시스템을 소비재 서비스로 바꾸겠다고 처음 발표했을 때, 많은 의문이 제기됐다. 어떤 형태를 갖게 될까? 어떤 식으로 소비될까? 그러나 가장 중요한 질문은 따로 있었다. '클라우드 분야의 거인으로 재탄생하려는 IBM의 노력에 얼마나 큰 힘이 될 것인가'라는 질문이었다.

2년 뒤, IBM은 블루믹스(Bluemix) PaaS 아래 여러 머신러닝 기반 서비스를 출시했다. 기상 예측, 언어 분석 시스템, 이미지 인식 시스템, 언어 번역, 감성 및 톤(tone) 분석을 예로 들 수 있다.

클라우드를 기반으로 머신 인텔리전스를 제공하는 기업 중에 가장 야심찬 기술 목록을 보유한 기업이 바로 IBM이다. 무엇보다 IBM은 '그림의 떡'과 같은 수준의 도구를 상대적으로 현실적인 도구를 통해 구현하려는 노력을 기울이고 있다. 주로 분석(analytics)과 리포팅(reporting)이 여기에 해당한다. IBM이 기상, 의료 등 여러 분야에서 전략적 인수를 다수 추진한 이면에는 왓슨을 성장시키기 위한 의도가 내포된 것으로 판단된다.

왓슨 서비스가 본격적으로 실용화될 수 있을 지 의문을 갖는 것은 어리석다. 때가 되면 그렇게 될 것이기 때문이다. 다만 IBM의 왓슨 서비스가 편안함을 느낄 수 있는 속도와 규모를 감당해낼 수 있을 지가 문제다. 대부분은 사용례를 찾기 위한 시간이 필요하다. 반면 입지가 튼튼한 스파크(Spark) 서비스와 AWS 람다(Lambda)를 닮은 서비스인 오픈위스크(OpenWhisk)는 즉시, 그리고 더 쉽게 수익화가 가능하다.

일부 기업과 조직은 창의적인 방법으로 왓슨의 분석 서비스를 구현하기 시작했다. IBM은 왓슨을 기반으로 한 사업을 연간 100억 달러 규모의 사업으로 키울 수 있다고 주장한다. 그러나 아직까지는 계속 추락하는 IBM의 매출을 상쇄시킬 정도의 성과를 일궈내지 못했다.

마이크로소프트, 당신을 위한, 당신에 의한 '구현'
IBM에게 왓슨이 있다면, 마이크로소프트는 머신 비전(machine vision), 음성 인식, 언어 분석을 포괄하는 고수준의 큐레이트 API 세트인 프로젝트 옥스포드(Project Oxford)가 있다.

API 리스트는 왓슨만큼 광범위하지 않다. 또한 하우올드넷(How-old.net)도 왓슨의 '제퍼디(Jeopardy!)'만큼 흥미롭지 않다. 그러나 마이크로소프트가 갖고 있는 의도는 유사하다. 머신러닝을 이용한 전용(proprietary) 큐레이트 API 세트다.

애저 머신러닝 스튜디오(Azure Machine Learning Studio)가 마이크로소프트의 머신러닝 목표에서 더 중요한 '절반'일 것이다. 이는 각자 데이터를 가져와 머신러닝 모델을 훈련시키고, REST 인터페이스를 통해 결과로 창출된 모델을 API로 재공유한다. IBM도 이와 유사한 블루믹스 기반의 예측 분석(Predictive Analytics) 서비스를 보유하고 있다. 그러나 마이크로소프트 스튜디오의 역사가 더 깊고, 더 폭넓은 용도를 갖고 있다.

IBM과 마이크로소프트 모두 2개의 각기 다른 머신러닝 서비스를 구현하고 있다. 큐레이트 데이터를 이용해 폐쇄적으로 동작을 조정하는 왓슨 API와 프로젝트와 옥스포드가 그 첫번째다. 두번째는 새로운 형태의 머신러닝 서비스를 구축, 공유, 더 나아가 수익화할 수 있는 플랫폼인 애저 머신러닝 스튜디오와 예측 분석이다.

마이크로소프트와 IBM의 가장 큰 차이점은 서비스가 아닌 '동기'이다. 마이크로소프트는 클라우드를 중심으로 미래를 대비하려 노력하고 있다. 그리고 게임 등 성공을 일궈낸 다른 비즈니스 부문이 이를 뒷받침하고 있다. 따라서 IBM과는 느끼는 압박감이 다르다. 그러나 이런 이유로 나아가야 할 방향을 인지하지 못하는 것은 아니다.

미니멀리스트인 아마존과 구글
구글, 특히 아마존의 클라우드를 설명하는 하나의 표현이 있다면, 그것은 '적을수록 좋다(less is more)'이다. 더 정확히 표현하면 '충분한 것이 좋다(just enough is more)'이다. 그리고 두 업체의 클라우드 기반 머신러닝 서비스에도 이 원칙이 동일하게 적용된다.

구글은 구글 클라우드 플랫폼(Google Cloud Platform)에서 단 2개의 서비스만 제공하고 있다. 구글의 기존 머신 번역 엔진을 지원하는 API인 구글 번역(Google Translate)과 구글 예측 API(Google Prediction API)다. 구글 번역은 구글이 독점적으로 운영하는 사유 API이며, 구글 예측 API는 마이크로소프트 애저 머신러닝 스튜디오와 같이 사용자가 데이터를 업로드, 모델을 훈련시키는 '포괄적'인 서비스다(데이터는 구글 빅쿼리(Google BigQuery)와 같은 구글 서비스에서 추출할 수 있다).

아마존 머신러닝(Amazon Machine Learning)은 데이터를 이용해 모델을 성장시키고, 이를 통해 예측을 한다는 점에서 구글 예측 API와 유사하다. 상대적으로 단순한 서비스다. 그 이유는 특정 문제 해결을 추구하는 개발자들을 끌어들일 의도이거나 시장 테스트에 목적이 있기 때문인 것으로 판단된다.

아마존과 구글 모두 니즈가 좁고, 이미 클라우드에 데이터를 저장하는 개발자가 대상이다. 즉 '딱 충분한' 모델이다. IBM과 마이크로소프트가 추구하는 대상은 이보다 넓다. 현재까지 제공할 것이 가장 많은 업체는 IBM이지만, 동시에 잃을 것도 가장 많다. editor@itworld.co.kr

X