Offcanvas

AI / How To / 가상화 / 개발자 / 데이터센터 / 머신러닝|딥러닝 / 서버 / 애플리케이션

리뷰 | VM웨어 위에서 AI를!··· 엔비디아 'AI 엔터프라이즈’ 살펴보기

2022.01.07 Martin Heller  |  InfoWorld
VM웨어 환경에 최적화된 이 엔비디아의 AI 소프트웨어 스택은 그야말로 강력한 대안이다. 여전히 머신러닝을 위해 AWS와 애저, 구글 클라우드를 이용할 수 있겠지만, 어느 정도 규모가 되는 기업이라면 엔비디아의 'AI 엔터프라이즈'를 검토할 만한 이유가 충분하다. 엔비디아 런치패드를 이용하면 시험 테스트도 그리 어렵지 않다. 
 
Image Credit : Getty Images Bank


엔비디아 AI 엔터프라이즈(Nvidia AI Enterprise)는 다양한 기능을 갖춘 엔드투엔드 AI 소프트웨어 스택이다. 데이터를 정화하고 훈련을 위해 준비하고, 신경망 훈련을 수행하고, 좀더 유효한 형식으로 모델을 변환해 추론 서버에 배치하는 업무 등을 수행한다.

아울러 엔비디아 AI 소프트웨어 스위트는 쿠버네티스를 위한 GPU, DPU(Data Processing Unit), 가속 네트워크를 지원한다(아래 그림 상의 클라우드 네이티브 전개 계층). 아울러 VM웨어 v스피어 탄주(VMware vSphere with Tanzu) 상에 있는 공유 기기의 최적화를 지원한다. 탄주 베이직(Tanzu Basic)은 v스피어에서 쿠버네티스를 실행하고 관리하는 데 도움을 준다. 참고로 VM웨어 탄주 랩(VMware Tanzu Labs)은 피보틀 랩(Pivotal Labs)의 새 명칭이다.

엔비디아 런치패드(Nvidia LaunchPad)는 전체 엔비디아 AI 스택을 사설 컴퓨트 인프라에서 실행하도록 허용하는 단기적 시험 프로그램이다. 엔비디아 런치패드는 엔비디아 AI 엔터프라이즈를 위한 정연한 랩을 제공하고, 엔비디아 전문가 및 훈련 모듈로의 접근 기능을 내장하고 있다.

엔비디아 AI 엔터프라이즈의 의미는 AI 모델 훈련 및 배치 작업이 좀더 자유로와질 수 있다는 것이다. 적어도 대형 기술 기업에게는 그렇다. Ph-D 수준의 데이터 과학자와 GPU로 가득한 데이터센터를 보유한 기업이라면, AI 엔터프라이즈를 통해 경영, 제품 개발, 마케팅, HR 등의 용도에 맞춰 AI 모델을 훈련시키고 배치할 수 있다. 


엔비디아 AI 엔터프라이즈 스택. 하단에는 가속 하드웨어가 있고, 상단에는 데이터 과학 툴 및 프레임워크가 있다.

엔비디아 AI 엔터프라이즈의 구성 요소 
엔비디아 AI 엔터프라이즈는 AI 솔루션의 개발 및 배치를 위한 종합적인 인프라 계층을 제공한다. 사전 훈련된 모델, 그리고 데이터 준비를 위한 GPU 인식 소프트웨어(RAPIDS), 그리고 텐서플로우(TensorFlow), 파이토치(PyTorch) 등 GPU 인식 딥러닝 프레임워크, 그리고 추론을 위해 모델을 보다 효율적 형태로 변환하는 소프트웨어(TensorRT), 그리고 확장성 있는 추론 서버(Triton) 등이다.

사전 훈련된 모델의 라이브러리는 엔비디아 AI 엔터프라이즈 소프트웨어 스위트와 함께 사용되는 엔비디아 NGC 카탈로그를 통해 이용할 수 있다. 그리고 엔비디아 AI 엔터프라이즈 텐서플로우 컨테이너(Nvidia AI Enterprise TensorFlow Containers) 등을 이용해 데이터베이스 상에서 AI 모델을 정밀하게 조율할 수 있다. 제공되는 딥러닝 프레임워크는 이의 오픈소스 버전을 기반으로 하지만 엔비디아 GPU에 맞춰 최적화됐다. 


엔비디아 AI 소프트웨어 스택 흐름도. 좌하단의 하드웨어 메모는 훈련에 관한 것이고, 우하단의 메모는 추론에 관한 것이다.

엔비디아 AI 엔터프라이즈 및 런치패드 하드웨어 
엔비디아는 DGX 시스템을 꾸준히 강조해왔다. DGX 시스템은 4~16개의 A100 GPU 를 다양한 폼팩터로 가지고 있다. 예를 들어 타워형 워크그룹 기기, 데이터센터를 위해 설계된 랙 기반 시스템 등이다. 

엔비디아는 대규모 배치를 감안한 DGX에 주력하고 있다. 그러나 런치패드 프로그램 하에서 엔비디아 AI 엔터프라이즈를 시험할 수 있도록 상용 서버로 구성된 1U ~ 2U 랙 마운트 시스템도 제공하고 있다.

이 상용 서버는 2개의 인텔 제온 골드 6354 CPU, 하나의 엔비디아 T4 또는 A30 GPU, 엔비디아 DPU에 기반한다. 세계적으로 9곳의 에퀴닉스(Equinix) 코로케이션 지역에는 런치패드 트라이얼 자격이 있는 엔비디아 고객이 사용할 이들 랙-마운트 서버가 20대씩 배치되어 있다.

엔비디아는 엔비디아 AI 엔터프라이즈를 기업에서 배치할 때에도 동일한 시스템을 권고한다. 시스템은 구매 가능하고 임대 또는 리스로 이용할 수도 있다. 


런치패드 및 엔비디아 AI 엔터프라이즈를 지원하는 서버 하드웨어. 런치패드 서버는 모두 Dell R750이지만, 이는 선호라기보다는 가용성의 문제였다. 상기 리스트는 엔비디아 AI 엔터프라이즈를 위해 엔비디아가 지원하는 적정 제조 서버를 공급하는 제조사다.

엔비디아 AI 엔터프라이즈 시험 사용해보기
엔비디아는 3가지 시험 사용 프로그램을 제공한다. 그저 맛만 보겠다는 AI 실무자라면 뉴욕시의 택시 요금을 예측하는 것과 BERT 텐서플로우 모델을 시험하는 것을 포함하는 시험 사용 데모가 있다. 시험 사용 시 1시간 정도의 직접 작업이 필요하고 48시간의 액세스가 제공된다.

런치패드는 약간 더 광범위하다. AI 실무자와 IT 직원에게 실습 랩을 제공하고, 이는 약 8시간의 직접 작업이 필요하다. 2주간의 시스템 액세스가 제공되고, 선택적으로 4주까지 연장될 수 있다.  

3번째 시험 사용 프로그램은 90일 온프레미스 평가이다. POC를 수행하기에 충분한 기간이다. 고객은 VM웨어 v스피어 7u2를 가진 (또는 그 이후 버전) 엔비디아 인증 시스템을 구매하거나 임대해야 하고, 엔비디아는 무료 평가 라이선스를 공급한다. 


엔비디아 AI 엔터프라이즈를 시험하는 방법은 3가지가 있다. 48시간 동안 액세스할 수 있는 1시간 테스트 시험 데모, 2주 동안 액세스할 수 있는 엔비디아 런치패드 8시간 랩, 그리고 온-프레미스 사용을 위한 90일 평가 라이선스이다.

추천 테크라이브러리

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.