2017.10.12

칼럼 | ‘구글의 진짜 혁신’ AI 카메라 클립스에서 보인다

Mike Elgan | Computerworld
구글이 최근 하드웨어 발표 행사에서 새로운 픽셀 브랜드 스마트폰 모델, 구글 홈 2종, 픽셀북 노트북 컴퓨터 1종, 픽셀버드(Pixel Buds) 이어폰, 구글 클립스라는 소비자용 카메라를 공개했다. 새 구글 제품 가운데 가장 흥미로운 제품은 구글 클립스다. 가장 흥미로운 트렌드를 대변하는 제품이기 때문이다. 이 카메라는 기업용 AI의 미래를 보여주고 있다.

물론 반론이 있을 수도 있다. 픽셀 버드가 가장 혁신적인 제품이라고 생각하는 사람들이 있을 것이다. 실시간 언어 번역 기능은 공상과학 영화나 소설에 나오는 것이었다. 언어 장벽을 없애는 기능은 인류의 미래에 큰 의미를 갖는다.

틀린 주장은 아니다. 구글을 포함해 많은 기업들이 실시간 언어 번역 소프트웨어를 구축, 스마트폰을 통해 전달하려 노력하고 있다. 구글 번역의 성능은 놀랍기까지 하다. 필자는 전 세계 각지를 여행하면서 여러 해 동안 구글 번역을 애용하고 있다.

번역 측면에서 픽셀 버드가 혁신적인 유일한 이유는 내부 스피커와 외부를 향한 스피커가 모두 장착되어 있다는 것이다. 일반적인 이어버드(내부) 스피커에서는 ‘입력’된 후 번역된 내용이 재생되며, 외부를 향한 스피커는 번역한 내용을 ‘출력’한다.

다시 말해, 픽셀 버드는 구글 번역을 음성으로 재생하는 기능을 제공한다. 또, 각각의 내용을 별도로 재생할 스피커를 지능적으로 선택할 수 있다.

굉장한 기능이지만, 지능적 스피커를 대단한 혁신 기능으로 평가하기는 힘들다. 반면, 구글 클립스는 진짜 혁신을 가져온 제품이다.

클립스가 가져올 변화
구글 클립스는 부모들을 위한 카메라이며, 가격은 249달러다.

구글이 ‘부모’라는 특정 집단을 표적으로 선택한 이유를 알아보기 전에, 먼저 카메라의 특징 몇 가지를 소개하겠다.


클립스는 1,200만 화소 카메라다. 가로와 세로가 각각 2인치인 정사각형 모양을 하고 있으며, 뒷면에는 클립이 있다. 앞면에는 검은색의 둥근 광각 렌즈가 장착되어 있다(촬영 각도 130도). 사진을 촬영할 때 불빛이 반짝거린다. 스파이 카메라가 아니라는 이야기이다.

클립스 카메라에는 화면이 없다. 카메라를 조작하고 촬영한 사진을 확인하려면 스마트폰을 사용해야 한다. 카메라에도 사진을 촬영할 수 있는 버튼이 있지만, ‘메인’ 버튼이라고 보기는 힘들다.

지금까지의 설명에서 이 칼럼에서도 소개했던 ‘라이프로깅(Lifelogging)’ 캠 같은 기존 제품을 떠올리는 사람도 있을 것이다.

그러나 혁신적인 것은 소프트웨어다. 구글 클립스는 인공 지능(AI)을 사용해 사진을 촬영할 시기를 선택한다. 렌즈를 돌려 시작 시점에 놓으면, 이후 카메라가 자동으로 작동한다.

카메라는 친숙한 얼굴을 학습하고, 알아서 사람과 반려견, 반려묘 등을 촬영한다. 웃는 모습, 움직이는 모습, 새로운 상황, 기타 기준을 찾아 적용해 촬영을 한다. 또 초점이 흐린 사진은 버린다.

속도는 매번 초당 15프레임 연사다. 좋아하는 정지 사진을 선택해 사용하거나, GIF로 편집할 수 있다. 마이크가 없어서 소리를 녹음할 수는 없다.

간단히 말해, 사진과 GIF 촬영에 AI를 사용하는 기기다. 그러나 사진 촬영자가 개입하는 바람에 ‘피사체’의 행동이 변화하는 단점 없이 사진을 촬영할 수 있다는 장점이 있다.

또한, 클라우드가 아닌 기기에서 바로 얼굴을 인식하는 기능이 혁신적이다. 촬영한 사진은 클라우드가 아닌 기기 내부에 저장된다.

바로 이 점이 개인 정보 보호 면에서 구글이 장점이라고 강조하는 부분이다. 소리를 녹음하지 않는다. 자동 업로드 기능도 없다.

물론 앱을 사용해 사진이나 GIF를 선택한 후 구글 사진(Google Photos)에 업로드 할 수 있다. 구글 사진에 사진을 올리면 자동으로 얼굴 인식 기능을 적용한다. 구글 사진에서 얼굴을 이름으로 분류하는 기능을 사용하고 있다면 이름이 붙여진다.

구글 클립스의 ‘표적’ 시장이 부모들인 이유
필자는 구글이 여러 표적 시장들을 하나씩 제거한 결과 ‘부모들’이라는 표적 시장을 찾았다고 추측한다.

구글은 구글 글래스에서 실패를 경험했다. 사람이 얼굴에 카메라를 착용하는 방식에 불편함을 느낀 소비자와 언론들이 많았기 때문이다.

이후 많은 신생 창업회사들이 사각형 모양의 ‘클립-온(부착용)’ 웨어러블 카메라를 선보였다. 그러나 비싼 가격, 낮은 사진 품질 때문에 실패한 제품이 많았다. 카메라를 ‘착용’한다는 개념에 적응하지 못한 사용자도 많았다.

구글 클립스의 외관은 이런 앞서 출시된 카메라를 닮았다. 필자는 구글이 AI 기반의 ‘클립-온’ 웨어러블 카메라를 최초로 출시해 시장을 선점하고 통합할 의도를 갖고 있었을 것으로 추정한다.

그러나 구글은 올바른 방향으로 제품 출시를 발표했다. 클립-온 카메라는 사진 품질이 아주 낮다. 선명하지 못한 사진이 많고, 각도가 잘못된 사진도 많다. 훌륭한 사용자 경험을 제공하지 못하는 것이다.

이런 이유로 구글은 클립스 카메라를 ‘웨어러블’ 카메라로 포지셔닝하지 않았다. 사진 품질 때문에 보안 카메라, 액션 카메라로도 적합하지 않다.

그러나 ‘부모'들은 완벽한 표적 시장이 될 수 있다. 바쁜 현대 부모들은 자녀들의 모습을 사진에 담을 시간이 부족하기 때문이다. 자녀들의 사진을 자주 촬영하면 다른 일이 방해를 받는다. 또, 아이들은 부모가 사진을 촬영하는 것을 안다. 이 경우, 행동을 멈추고 포즈를 취하거나, 사진에 대해 불평을 하기 일쑤다.

이럴 때 클립스 카메라가 ‘해결책'이 될 수 있다. 설정을 한 후 잊어버려도 된다. 나중에 카메라가 ‘놀라운 순간’을 포착한 것을 확인하게 될지도 모른다.

프라이버시와 보안이 철저한 것이 특징이므로 자동 업로드 기능이 없고, 직접 수동으로 업로드 해야 한다.

진짜 혁신은 ‘카메라와 AI를 통합’한 것
구글의 목적은 카메라 판매가 아닐 것이다. 카메라 기반의 AI를 실현시키는 길을 찾는 것이다.

구글은 데이터를 새로운 방식으로 활용, 사용자와 고객, 인류에게 편익을 가져오는 방법을 찾는 과정에서 클립스 같은 제품을 구상해 개발한다.

머신 러닝을 중심으로 센서 기반의 데이터에서 ‘액션’과 ‘인사이트’를 발생시키는 새로운 기회를 AI가 제공하는 것이다.

데이터의 품질, 카메라의 보편성을 감안했을 때, 카메라는 ‘모든 센서의 어머니’라 할 수 있다.

사람들은 프라이버시 침해를 우려한다. 실제로 프라이버시 침해가 만연한 것이 현실이기도 하다. AI를 카메라 데이터에 안전하게 적용하는 방법은 무엇일까? 카메라에 통합하는 것이다.

부모들을 대상으로 한 카메라는 나중에 대시 카메라, 웹캠, 보안 카메라, 궁극적으로 모든 카메라로까지 확대될 수 있다. 카메라에 AI를 통합하면, 기업이나 산업에서 사용하는 카메라는 사진이나 영상이 아닌 인사이트를 결과물로 제공하게 될 것이다.

이 시도는 기업의 모든 것을 변화시킬 잠재력을 갖고 있다.

결과물이 이미지가 아닌 데이터인 AI 기반 카메라가 가져올 ‘가능성’을 생각해 보자.

아주 큰 창고 곳곳에 설치된 AI 기반 카메라를 떠올리자. 창고에 들어온 사람, 창고에서 나간 사람을 분 단위로 알려준다. 특정 시간에 창고에 보관하고 있던 제품 등 유용한 데이터를 제공한다. 데이터와 이미지를 함께 사용하는 애플리케이션도 있다.

보안 카메라는 구글 클립스와 정반대로 기능한다. 정문을 경비하는 보안 요원들처럼 친숙한 사람은 무시하고, 친숙하지 않은 사람의 행동과 움직임은 확대, 추적, 녹화한다. AI는 의심스러운 행동을 파악해 보고할 수 있다. 나중에 이미지를 증거로 추출하는 기능도 갖고 있다.

소비자의 ‘감정’을 측정하는 기능도 구현할 수 있다.

이와 관련하면 실버 로직 랩스(Silver Logic Labs)라는 회사는 영상에서 사람들의 감정을 파악하는 알고리즘을 개발하고 있다. 닐슨 시청률을 시청자의 감정을 보여주는 실시간 데이터로 대체할 수도 있다. 널리 보급된 노트북 컴퓨터 웹캠을 이용할 수 있는 기술이다.

소비자들은 자신의 얼굴 표정이 담긴 비디오가 클라우드에 업로드, 저장되고, 인식되고, 처리되는 것을 흔쾌히 받아들이지 않을 것이다. 그러나 카메라에 계속 저장되고, 암호화 및 익명화 된 데이터만 전송될 경우, 소비자는 계속 프라이버시를 유지할 수 있고, TV 방송국과 광고주 또한 시청자의 반응을 측정하는 시스템을 운영할 수 있다.

이런 기술은 인간의 생명을 구할 수도 있다. 실버 로직의 기술을 활용해 심장 마비를 예측할 수 있다. 또한, 경찰은 진짜 위협을 식별할 수 있다. 이를 위해서는 ‘프라이버시’ 측면의 장애물을 극복해야 한다. 사진을 전송할 수 없는 카메라, 사법부에서 허락을 받은 사람들만 데이터를 공유할 수 있는 기능 등은 프라이버시 문제를 해결할 방법이 될 수 있다.

카메라는 AI를 통해 처리될 데이터에 아주 큰 도움을 줄 수 있는 ‘궁극의 센서’다. 그러나 지금 당장은 프라이버시가 혁신을 가로막고 있다.

바로 이 해결책을 구글 클립스에서 발견할 수 있다. AI를 카메라에 통합해 프라이버시를 위협하지 않으면서 카메라 데이터를 유용하게 활용할 수 있기 때문이다.
구글이 클립스를 개발한 이유가 여기에 있다. AI 통합 카메라는 프라이버시를 침해하지 않으면서, 많은 혜택을 가져다 줄 것이다. editor@itworld.co.kr  
2017.10.12

칼럼 | ‘구글의 진짜 혁신’ AI 카메라 클립스에서 보인다

Mike Elgan | Computerworld
구글이 최근 하드웨어 발표 행사에서 새로운 픽셀 브랜드 스마트폰 모델, 구글 홈 2종, 픽셀북 노트북 컴퓨터 1종, 픽셀버드(Pixel Buds) 이어폰, 구글 클립스라는 소비자용 카메라를 공개했다. 새 구글 제품 가운데 가장 흥미로운 제품은 구글 클립스다. 가장 흥미로운 트렌드를 대변하는 제품이기 때문이다. 이 카메라는 기업용 AI의 미래를 보여주고 있다.

물론 반론이 있을 수도 있다. 픽셀 버드가 가장 혁신적인 제품이라고 생각하는 사람들이 있을 것이다. 실시간 언어 번역 기능은 공상과학 영화나 소설에 나오는 것이었다. 언어 장벽을 없애는 기능은 인류의 미래에 큰 의미를 갖는다.

틀린 주장은 아니다. 구글을 포함해 많은 기업들이 실시간 언어 번역 소프트웨어를 구축, 스마트폰을 통해 전달하려 노력하고 있다. 구글 번역의 성능은 놀랍기까지 하다. 필자는 전 세계 각지를 여행하면서 여러 해 동안 구글 번역을 애용하고 있다.

번역 측면에서 픽셀 버드가 혁신적인 유일한 이유는 내부 스피커와 외부를 향한 스피커가 모두 장착되어 있다는 것이다. 일반적인 이어버드(내부) 스피커에서는 ‘입력’된 후 번역된 내용이 재생되며, 외부를 향한 스피커는 번역한 내용을 ‘출력’한다.

다시 말해, 픽셀 버드는 구글 번역을 음성으로 재생하는 기능을 제공한다. 또, 각각의 내용을 별도로 재생할 스피커를 지능적으로 선택할 수 있다.

굉장한 기능이지만, 지능적 스피커를 대단한 혁신 기능으로 평가하기는 힘들다. 반면, 구글 클립스는 진짜 혁신을 가져온 제품이다.

클립스가 가져올 변화
구글 클립스는 부모들을 위한 카메라이며, 가격은 249달러다.

구글이 ‘부모’라는 특정 집단을 표적으로 선택한 이유를 알아보기 전에, 먼저 카메라의 특징 몇 가지를 소개하겠다.


클립스는 1,200만 화소 카메라다. 가로와 세로가 각각 2인치인 정사각형 모양을 하고 있으며, 뒷면에는 클립이 있다. 앞면에는 검은색의 둥근 광각 렌즈가 장착되어 있다(촬영 각도 130도). 사진을 촬영할 때 불빛이 반짝거린다. 스파이 카메라가 아니라는 이야기이다.

클립스 카메라에는 화면이 없다. 카메라를 조작하고 촬영한 사진을 확인하려면 스마트폰을 사용해야 한다. 카메라에도 사진을 촬영할 수 있는 버튼이 있지만, ‘메인’ 버튼이라고 보기는 힘들다.

지금까지의 설명에서 이 칼럼에서도 소개했던 ‘라이프로깅(Lifelogging)’ 캠 같은 기존 제품을 떠올리는 사람도 있을 것이다.

그러나 혁신적인 것은 소프트웨어다. 구글 클립스는 인공 지능(AI)을 사용해 사진을 촬영할 시기를 선택한다. 렌즈를 돌려 시작 시점에 놓으면, 이후 카메라가 자동으로 작동한다.

카메라는 친숙한 얼굴을 학습하고, 알아서 사람과 반려견, 반려묘 등을 촬영한다. 웃는 모습, 움직이는 모습, 새로운 상황, 기타 기준을 찾아 적용해 촬영을 한다. 또 초점이 흐린 사진은 버린다.

속도는 매번 초당 15프레임 연사다. 좋아하는 정지 사진을 선택해 사용하거나, GIF로 편집할 수 있다. 마이크가 없어서 소리를 녹음할 수는 없다.

간단히 말해, 사진과 GIF 촬영에 AI를 사용하는 기기다. 그러나 사진 촬영자가 개입하는 바람에 ‘피사체’의 행동이 변화하는 단점 없이 사진을 촬영할 수 있다는 장점이 있다.

또한, 클라우드가 아닌 기기에서 바로 얼굴을 인식하는 기능이 혁신적이다. 촬영한 사진은 클라우드가 아닌 기기 내부에 저장된다.

바로 이 점이 개인 정보 보호 면에서 구글이 장점이라고 강조하는 부분이다. 소리를 녹음하지 않는다. 자동 업로드 기능도 없다.

물론 앱을 사용해 사진이나 GIF를 선택한 후 구글 사진(Google Photos)에 업로드 할 수 있다. 구글 사진에 사진을 올리면 자동으로 얼굴 인식 기능을 적용한다. 구글 사진에서 얼굴을 이름으로 분류하는 기능을 사용하고 있다면 이름이 붙여진다.

구글 클립스의 ‘표적’ 시장이 부모들인 이유
필자는 구글이 여러 표적 시장들을 하나씩 제거한 결과 ‘부모들’이라는 표적 시장을 찾았다고 추측한다.

구글은 구글 글래스에서 실패를 경험했다. 사람이 얼굴에 카메라를 착용하는 방식에 불편함을 느낀 소비자와 언론들이 많았기 때문이다.

이후 많은 신생 창업회사들이 사각형 모양의 ‘클립-온(부착용)’ 웨어러블 카메라를 선보였다. 그러나 비싼 가격, 낮은 사진 품질 때문에 실패한 제품이 많았다. 카메라를 ‘착용’한다는 개념에 적응하지 못한 사용자도 많았다.

구글 클립스의 외관은 이런 앞서 출시된 카메라를 닮았다. 필자는 구글이 AI 기반의 ‘클립-온’ 웨어러블 카메라를 최초로 출시해 시장을 선점하고 통합할 의도를 갖고 있었을 것으로 추정한다.

그러나 구글은 올바른 방향으로 제품 출시를 발표했다. 클립-온 카메라는 사진 품질이 아주 낮다. 선명하지 못한 사진이 많고, 각도가 잘못된 사진도 많다. 훌륭한 사용자 경험을 제공하지 못하는 것이다.

이런 이유로 구글은 클립스 카메라를 ‘웨어러블’ 카메라로 포지셔닝하지 않았다. 사진 품질 때문에 보안 카메라, 액션 카메라로도 적합하지 않다.

그러나 ‘부모'들은 완벽한 표적 시장이 될 수 있다. 바쁜 현대 부모들은 자녀들의 모습을 사진에 담을 시간이 부족하기 때문이다. 자녀들의 사진을 자주 촬영하면 다른 일이 방해를 받는다. 또, 아이들은 부모가 사진을 촬영하는 것을 안다. 이 경우, 행동을 멈추고 포즈를 취하거나, 사진에 대해 불평을 하기 일쑤다.

이럴 때 클립스 카메라가 ‘해결책'이 될 수 있다. 설정을 한 후 잊어버려도 된다. 나중에 카메라가 ‘놀라운 순간’을 포착한 것을 확인하게 될지도 모른다.

프라이버시와 보안이 철저한 것이 특징이므로 자동 업로드 기능이 없고, 직접 수동으로 업로드 해야 한다.

진짜 혁신은 ‘카메라와 AI를 통합’한 것
구글의 목적은 카메라 판매가 아닐 것이다. 카메라 기반의 AI를 실현시키는 길을 찾는 것이다.

구글은 데이터를 새로운 방식으로 활용, 사용자와 고객, 인류에게 편익을 가져오는 방법을 찾는 과정에서 클립스 같은 제품을 구상해 개발한다.

머신 러닝을 중심으로 센서 기반의 데이터에서 ‘액션’과 ‘인사이트’를 발생시키는 새로운 기회를 AI가 제공하는 것이다.

데이터의 품질, 카메라의 보편성을 감안했을 때, 카메라는 ‘모든 센서의 어머니’라 할 수 있다.

사람들은 프라이버시 침해를 우려한다. 실제로 프라이버시 침해가 만연한 것이 현실이기도 하다. AI를 카메라 데이터에 안전하게 적용하는 방법은 무엇일까? 카메라에 통합하는 것이다.

부모들을 대상으로 한 카메라는 나중에 대시 카메라, 웹캠, 보안 카메라, 궁극적으로 모든 카메라로까지 확대될 수 있다. 카메라에 AI를 통합하면, 기업이나 산업에서 사용하는 카메라는 사진이나 영상이 아닌 인사이트를 결과물로 제공하게 될 것이다.

이 시도는 기업의 모든 것을 변화시킬 잠재력을 갖고 있다.

결과물이 이미지가 아닌 데이터인 AI 기반 카메라가 가져올 ‘가능성’을 생각해 보자.

아주 큰 창고 곳곳에 설치된 AI 기반 카메라를 떠올리자. 창고에 들어온 사람, 창고에서 나간 사람을 분 단위로 알려준다. 특정 시간에 창고에 보관하고 있던 제품 등 유용한 데이터를 제공한다. 데이터와 이미지를 함께 사용하는 애플리케이션도 있다.

보안 카메라는 구글 클립스와 정반대로 기능한다. 정문을 경비하는 보안 요원들처럼 친숙한 사람은 무시하고, 친숙하지 않은 사람의 행동과 움직임은 확대, 추적, 녹화한다. AI는 의심스러운 행동을 파악해 보고할 수 있다. 나중에 이미지를 증거로 추출하는 기능도 갖고 있다.

소비자의 ‘감정’을 측정하는 기능도 구현할 수 있다.

이와 관련하면 실버 로직 랩스(Silver Logic Labs)라는 회사는 영상에서 사람들의 감정을 파악하는 알고리즘을 개발하고 있다. 닐슨 시청률을 시청자의 감정을 보여주는 실시간 데이터로 대체할 수도 있다. 널리 보급된 노트북 컴퓨터 웹캠을 이용할 수 있는 기술이다.

소비자들은 자신의 얼굴 표정이 담긴 비디오가 클라우드에 업로드, 저장되고, 인식되고, 처리되는 것을 흔쾌히 받아들이지 않을 것이다. 그러나 카메라에 계속 저장되고, 암호화 및 익명화 된 데이터만 전송될 경우, 소비자는 계속 프라이버시를 유지할 수 있고, TV 방송국과 광고주 또한 시청자의 반응을 측정하는 시스템을 운영할 수 있다.

이런 기술은 인간의 생명을 구할 수도 있다. 실버 로직의 기술을 활용해 심장 마비를 예측할 수 있다. 또한, 경찰은 진짜 위협을 식별할 수 있다. 이를 위해서는 ‘프라이버시’ 측면의 장애물을 극복해야 한다. 사진을 전송할 수 없는 카메라, 사법부에서 허락을 받은 사람들만 데이터를 공유할 수 있는 기능 등은 프라이버시 문제를 해결할 방법이 될 수 있다.

카메라는 AI를 통해 처리될 데이터에 아주 큰 도움을 줄 수 있는 ‘궁극의 센서’다. 그러나 지금 당장은 프라이버시가 혁신을 가로막고 있다.

바로 이 해결책을 구글 클립스에서 발견할 수 있다. AI를 카메라에 통합해 프라이버시를 위협하지 않으면서 카메라 데이터를 유용하게 활용할 수 있기 때문이다.
구글이 클립스를 개발한 이유가 여기에 있다. AI 통합 카메라는 프라이버시를 침해하지 않으면서, 많은 혜택을 가져다 줄 것이다. editor@itworld.co.kr  
X