Offcanvas

AI / How To / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스

컴퓨터 비전에 노코드를… 구글의 ‘버텍스 AI 비전’ 속속들이 살펴보기

2022.12.09 Janakiram MSV  |  InfoWorld
‘버텍스 AI 비전(Vertex AI Vision)’은 비디오 소스, 머신러닝 모델, 데이터 웨어하우스를 결합하여 풍부한 인사이트와 컴퓨터 비전 분석을 제공한다.

비전 AI 애플리케이션을 개발하고 배포하는 일은 복잡하고 비용이 많이 든다. 우선 기업은 이미지, 비디오 등 비정형 데이터를 기반으로 학습 및 추론 파이프라인을 구축하기 위해 데이터 과학자와 머신러닝 엔지니어가 필요하다. 하지만 숙련된 머신러닝 엔지니어가 부족해 기업의 지능형 비전 AI 애플리케이션 구축 및 통합 비용이 커졌다.
 
ⓒGetty Images Bank

이에 구글, 인텔, 메타, 마이크로소프트, 엔비디아, 오픈AI 등이 사전 학습된 모델을 (고객에게) 제공하고 있다. 개발자는 얼굴 감지, 감정 감지, 자세 감지, 차량 감지 등의 사전 학습된 모델을 사용하여 지능형 비전 기반 애플리케이션을 개발할 수 있다. 많은 기업이 보안을 위해 CCTV, 감시, IP 카메라에 투자했다. 이러한 카메라는 사전 학습된 기존 모델에 연결할 수 있지만 점(데이터)을 연결하는 데 필요한 작업이 너무 복잡하다.

비전 AI 추론 파이프라인 구축하기
기존 카메라와 사전 학습된 모델 또는 사용자 정의 모델에서 인사이트를 얻기 위해 비전 AI 추론 파이프라인을 구축하려면 타깃 모델에 맞춰 비디오 스트림을 처리, 인코딩, 정규화해야 한다. 이를 완료하면 시각적 대시보드 및 애널리틱스를 통해 (인사이트를 제공하기 위한) 메타데이터와 추론 결과를 수집해야 한다.

플랫폼 업체의 경우 비전 AI 추론 파이프라인은 비디오 소스, 모델, 애널리틱스 엔진 등에서 ‘점’을 연결하는 도구 및 개발 환경을 구축할 기회를 제공한다. 개발 환경이 노코드/로우코드를 지원한다면 이 프로세스를 더욱더 가속화하고 간소화할 수 있다.
 
그림 1. 버텍스 AI 비전을 통한 비전 AI 추론 파이프라인 구축 ⓒIDG

‘버텍스 AI 비전’이란?
구글의 버텍스 AI 비전을 사용하면 기업은 어렵고 복잡한 과정 없이 컴퓨터 비전 AI를 애플리케이션에 원활하게 통합할 수 있다. 이 통합 환경은 비디오 소스, 머신러닝 모델, 데이터 웨어하우스를 결합하여 인사이트와 풍부한 애널리틱스를 제공한다. 고객은 해당 환경 내에서 하는 사전 학습된 모델을 활용하거나, 버텍스 AI 플랫폼에서 학습된 사용자 정의 모델을 가져올 수 있다.
 
그림 2. 사전 학습된 모델 또는 베텍스 AI 플랫폼에서 학습된 사용자 정의 모델을 쓸 수 있다.  ⓒIDG

버텍스 AI 비전 애플리케이션은 시각적 팔레트에서 구성 요소를 드래그 앤 드롭하여 AI 비전 추론 파이프라인을 구축할 수 있는 빈 캔버스로 시작된다.
 
그림 3. 구성 요소를 드래그 앤 드롭하여 파이프라인을 구축하는 모습 ⓒIDG

팔레트에는 카메라/비디오 스트림, 일련의 사전 학습된 모델, 특정 산업용 특수 모델, 오토ML(AutoML) 또는 버텍스 AI를 사용하여 구축된 사용자 정의 모델, 빅쿼리(BigQuery) 및 AI 비전 웨어하우스(AI Vision Warehouse) 형식의 데이터 저장소를 포함해 다양한 커넥터가 있다.

구글 클라우드에 따르면 버텍스 AI 비전은 다음의 서비스를 제공한다.

• 버텍스 AI 비전 스트림(Vertex AI Vision Streams): 지리적으로 분산된 네트워크에서 비디오 스트림 및 이미지를 수집하기 위한 엔드포인트 서비스다. 어디서든 카메라 또는 기기를 연결하면 구글이 확장 및 수집을 처리한다.

• 버텍스 AI 비전 애플리케이션(Vertex AI Vision Applications): 개발자는 이 서버리스 오케스트레이션 플랫폼을 사용하여 광범위한 자동 확장 미디어 처리 및 애널리틱스 파이프라인을 구축할 수 있다.

• 버텍스 AI 비전 모델(Vertex AI Vision Models): 사용량 계산, PPE 감지, 얼굴 블러 처리, 소매 제품 인식 등 일반적인 애널리틱스 작업을 위해 사전 구축된 비전 모델이다. 또 사용자는 버텍스 AI 플랫폼 내에서 학습된 자체 모델을 구축하고 배포할 수 있다.

• 버텍스 AI 비전 웨어하우스(Vertex AI Vision Warehouse): 구글 검색과 관리형 비디오 스토리지를 결합하는 통합 서버리스 리치 미디어 스토리지 시스템이다. 페타바이트 단위의 비디오 데이터를 웨어하우스 안에서 수집, 저장, 검색할 수 있다.

예를 들면 아래의 파이프라인은 단일 소스에서 비디오를 수집하고, 사람/차량 카운터로 전달하며, 입력 및 출력(추론) 메타데이터를 AI 비전 웨어하우스에 저장한 후 단순한 쿼리를 실행한다. 이를 빅쿼리로 대체하여 기존 애플리케이션과 통합하거나 복잡한 SQL 기반 쿼리를 수행할 수 있다.
 
그림 4. 버텍스 AI 비전으로 구축된 샘플 파이프라인 ⓒIDG

버텍스 AI 비전 파이프라인 배포하기
파이프라인이 시각적으로 구축되면 이를 배포하여 추론을 시작할 수 있다. 그림 5의 녹색 체크 표시는 성공적인 배포를 의미한다. 
 
그림 5. 녹색 체크 표시는 파이프라인이 배포됐다는 의미다.  ⓒIDG

다음 단계는 추론을 시작하기 위해 비디오 피드를 수집하는 것이다. 구글은 소스에서 비디오 스트림을 가져와 버텍스 AI 비전 엔드포인트로 전달하는 명령줄 도구(vaictl)를 제공한다. H.264 인코딩 기반의 정적 비디오 파일과 RTSP 스트림을 모두 지원한다.

파이프라인이 작동하면 그림 6과 같이 콘솔에서 입력 및 출력 스트림을 모니터링할 수 있다. 
 
그림 6. 콘솔에서의 입력 및 출력 스트림 모니터링 ⓒIDG

추론 결과는 AI 비전 웨어하우스에 저장되기 때문에 검색 기준에 따라 쿼리할 수 있다. 예를 들어 그림 7은 최소 5명의 사람 또는 5대의 차량이 포함된 프레임을 보여준다.
 
그림 7. 추론 출력을 위한 샘플 쿼리 ⓒIDG

아울러 구글은 웨어하우스와 프로그래밍 방식으로 통신할 수 있는 SDK를 제공한다. 빅쿼리 개발자는 기존 라이브러리를 사용하여 ANSI SQL을 기반으로 고급 쿼리를 실행할 수 있다. 

엣지에서의 버텍스 AI 비전 통합 및 지원
버텍스 AI 비전은 구글의 관리형 머신러닝 PaaS ‘버텍스 AI’와 긴밀하게 통합돼 있다. 고객들은 오토ML 또는 사용자 정의 학습을 통해 모델을 훈련할 수 있다. 출력에 사용자 정의 처리를 추가하기 위해 구글은 출력을 조작하여 주석이나 추가 메타데이터를 더할 수 있는 클라우드 펑션(Cloud Functions)을 통합했다.

버텍스 AI 비전 플랫폼의 진정한 잠재력은 노코드 접근 방식, 빅쿼리, 클라우드 펑션, 버텍스 AI 등 다른 구글 클라우드 서비스와 통합할 수 있는 기능에 있다.

버텍스 AI 비전은 비전 AI를 간소화하기 위한 훌륭한 방법이지만 엣지에 애플리케이션을 배포하려면 추가적인 지원이 필요하다. 의료, 보험, 자동차 등의 산업 분야는 지연 속도를 피하고, 컴플라이언스를 충족하기 위해 엣지에서 비전 AI 파이프라인을 실행하는 것을 선호한다. 엣지 지원 추가는 이후 버텍스 AI 비전의 핵심 동인이 될 것이다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.