Offcanvas

디지털 트랜스포메이션 / 디지털 트윈 / 머신러닝|딥러닝 / 비즈니스|경제 / 클라우드

칼럼ㅣ“내가 AI라고 해도 놀라지 마세요” 젠슨 황의 농담에 담긴 의미

2022.09.29 Peter Sayer  |  CIO
엔비디아의 CEO 젠슨 황은 “내가 AI라고 해도 놀라지 마세요”라고 농담을 던졌지만 이 회사의 연례 개발자 컨퍼런스(GTC)에서 시연된 클라우드 기반 서비스형 시뮬레이션(simulation-as-a-service) 기술을 봤다면 그의 농담을 진지하게 받아들일 수밖에 없을 것이다. 

그래픽 칩(GPU) 공급업체에 불과했던 이 회사가 풀스택 컴퓨팅 서비스 제공업체로 거듭나고 있다. 엔비디아가 서비스형 하드웨어 및 소프트웨어를 모두 제공하는 클라우드로 이동하고 있다. 지난주 개최된 엔비디아의 GTC(GPU Technology Conference) 컨퍼런스에서 황은 게이머를 위한 몇 가지 새로운 장난감을 선보이긴 했지만 기조연설의 대부분은 이 회사가 엔터프라이즈 컴퓨팅을 가속하기 위해 CIO들에게 제공하는 도구를 설명하는 데 할애했다.
 
ⓒJensen Huang

이를테면 새로운 에이다 러브레이스(Ada Lovelace) 아키텍처를 기반으로 한 RTX GPU, 자율주행차용 칩, 자율 시스템을 위한 IGX 엣지 컴퓨팅 플랫폼 등이다. 하드웨어만 있었던 건 아니다. 소프트웨어(신약 개발, 생물학 연구, 언어 처리, 산업용 메타버스 구축용)와 컨설팅, 사이버 보안, 클라우드 기반의 서비스형 소프트웨어와 인프라 등의 서비스도 있었다. 

황은 기조연설을 하는 동안 다양한 데모를 선보였다. ▲ 단일 프로세서가 자연스러운 조명 효과로 장면을 사진처럼 실감 나게 실시간 렌더링하는 모습, ▲ 누락된 프레임을 채워 넣어 애니메이션을 매끄럽게 만들고 속도를 높일 수 있는 AI, ▲ 맥락에 따라 대화에 답할 수 있도록 AI용 대규모 언어 모델을 학습시키는 방법 등이었다. 

키노트를 마친 후 기자들과 화상회의를 하던 황이 화면 속에서 “내가 AI라고 해도 놀라지 마세요”라고 농담을 던진 순간, 앞서 선보인 데모들이 어느 정도 그럴듯하게 느껴졌다. 

CIO들은 장비 예산을 늘리지 않고도 조직 전체에 새로운 기능을 제공할 수 있는 엔비디아의 새 클라우드 서비스에 관심이 많으리라 예상된다. 하드웨어 비용은 상승할 가능성이 높고, 반도체 트랜지스터 수를 늘리는 기술이 한계에 봉착했기 때문이다. 

황은 마이크로 칩에 집적하는 트랜지스터 수가 약 2년마다 2배로 증가할 것이라는 1965년 고든 무어의 말에서 나온 “무어의 법칙이 완전히 끝났다”라고 단언했다. 그는 “시간이 지나면 칩 가격이 내려갈 것이라는 생각도 안타깝지만 옛날 일이다”라고 덧붙였다. 

엔비디아 같은 반도체 제조업체가 겪는 고충의 원인은 다양하다. 일례로 제조 장비 및 공장이 부족하고, 실리콘 웨이퍼 칩과 네온가스(러시아의 우크라이나 침공으로 공급에 차질을 빚고 있음) 등의 원자재 비용이 상승하고 있다. 황은 “12인치 웨이퍼 가격이 급등했다. 조금 더 비싼 정도가 아니라 훨씬 더 비싸다”라고 말했다. 

이러한 비용 상승에 대처하는 엔비디아의 방식은 고객들이 (엔비디아의) 프로세서를 최대한 활용하여 가격 대비 성능 균형을 해결하도록 최적화된 소프트웨어를 개발하는 것이다. “가속화된 풀스택이 핵심이다. 컴퓨팅은 칩 문제가 아니라, 소프트웨어 및 칩 문제이자 풀스택 문제다”라고 그는 전했다.

네모(NeMo) 
이를 위해 엔비디아는 이제 막 생산에 돌입한 새 H100 칩에 맞춰 네모(NeMo) 대규모 언어 모델 학습 소프트웨어를 최적화하고 있다고 발표했다. H100은 이 회사가 지난 3월 GTC 컨퍼런스에서 공개한 호퍼(Hopper) 아키텍처 기반의 첫 번째 칩이다. 이 밖에 마이크로소프트 딥스피드(Microsoft DeepSpeed), 구글 JAX(Google JAX), 파이토치(PyTorch), 텐서플로우(TensorFlow), XLA 등의 딥러닝 프레임워크도 H100에 맞게 최적화하는 중이라고 회사 측은 밝혔다.

네모가 옴니버스(Omniverse)와 함께, 엔비디아 최초 클라우드 기반 서비스로 판매될 제품이라는 점도 주목할 만하다.

네모 LLM 서비스(NeMo Large Language Model Service)를 활용하면 인간 언어와 컴퓨터 코드로 응답을 처리하거나 예측하기 위해 엔비디아에서 구축한 대규모 언어 모델의 반응을 학습시키거나 조정할 수 있다. 이 서비스와 친척인 바이오네모 LLM 서비스(BioNeMo LLM Service)는 비슷한 작업을 단백질 구조를 대상으로 수행하여 생체 분자 성질을 예측한다.

이 분야에서 엔비디아가 최근 이룩한 혁신은 수십억 개의 매개변수로 구축된 모델을 가져와 수백 개의 데이터 포인트를 사용해 미세 조정할 수 있게 하여 기업들이 사용하는 챗봇이 특정 맥락에 더욱더 적절하게 응답할 수 있도록 한 것이다. 

예를 들어 “렌탈 옵션은 무엇입니까?”라는 질문에 ISP의 챗봇은 “월 5달러에 모뎀을 대여할 수 있습니다”, 렌터카 회사의 챗봇은 “이코노미, 소형, 대형 차량을 제공할 수 있습니다”, 그리고 자산 관리 기관의 챗봇은 “원룸에서 쓰리룸까지 있습니다”라고 응답하도록 조정할 수 있다.

엔비디아는 이러한 조정은 몇 시간 안에 할 수 있지만, 모델을 처음부터 학습시키려면 몇 달이 걸린다고 말했다. 조정된 모델은 일단 생성되면 원래 모델과 결합된 ‘프롬프트 토큰(prompt token)’을 사용해 불러올 수도 있다. 기업들은 이 모델을 오는 10월부터 온프레미스 또는 클라우드에서 실행할 수 있고, API를 통해 엔비디아 클라우드에서 접근할 수 있다.

옴니버스 클라우드(Omniverse Cloud)
엔비디아의 옴니버스 플랫폼은 이 회사가 제공하는 또 다른 클라우드 서비스 제품군의 기반이다. 황은 옴니버스 플랫폼에 3가지 핵심 기능이 있다면서, “첫째는 현실 세계의 3차원 정보를 수집하고 저장하는 기능이다. 클라우드의 최신 데이터베이스라고 할 수 있다. 둘째, 장치와 사람 또는 소프트웨어 에이전트를 해당 정보와 그리고 상호 간에 연결하는 기능이다. 그리고 세 번째는 이 새로운 세계를 들여다볼 창문, 달리 말하면 시뮬레이션 엔진이다”라고 설명했다.

이러한 시뮬레이션의 대상은 기업이 제조 시설 또는 제품의 디지털 트윈을 생성한다면 현실 세계가 될 수 있고, 아니면 시뮬레이션된 센서 데이터를 제공하여 센서 네트워크(옴니버스 레플리케이터(Omniverse Replicator) 사용), 로봇(아이작 심(Issac Sim)사용), 자율주행차(드라이브 심(Drive Sim) 사용)를 학습시키는 데 사용되는 가상 세계일 수도 있다. 

이 밖에 온라인 협업에 활용할 수 있는 3D 장면 및 데이터를 위한 공유 USC(Universal Scene Description) 저장소를 제공하는 ‘옴니버스 뉴클리어스 클라우드(Omniverse Nucleus Cloud)’와 옴니버스를 사용하여 장면을 렌더링하고 합성 데이터를 생성하는 확장된 도구인 ‘옴니버스 팜(Omniverse Farm)’도 있다.

지멘스(Siemens)는 이미 옴니버스 플랫폼을 사용하여 제조용 디지털 트윈을 개발하고 있다. 엔비디아는 옴니버스 클라우드를 사용 중인 고객들을 대상으로 이러한 서비스를 제공하고자 하고 있다고 밝혔다.

옴니버스 팜, 레플리케이터, 아이작 심은 이미 기업들이 엔비디아 GPU를 탑재한 AWS 컴퓨팅 클라우드 인스턴스에 배포할 수 있는 컨테이너로 제공되지만 다른 옴니버스 클라우드 애플리케이션은 엔비디아 관리형 서비스로 사용하려면 GA 버전을 기다려야 한다. 이 회사는 현재 얼리 액세스 신청을 받고 있다. 

또한 엔비디아는 기업들의 새 제품과 서비스 사용을 지원하는 새로운 채널도 열고 있다. 이를테면 경영 컨설팅 업체 부즈 알렌 해밀턴(Booz Allen Hamilton)은 AI 사이버 보안 처리 프레임워크 ‘엔비디아 모피어스(Nvidia Morpheus)’를 기반으로 구축된 ‘사이버 프리코그(Cyber Precog)’라는 새로운 사이버 보안 서비스를 제공하며, 딜로이트는 엔비디아의 옴니버스 소프트웨어 제품군을 중심으로 엔터프라이즈 서비스를 제공할 예정이다.

엔비디아가 컨설팅 업체 및 시스템 통합업체와 협력해 SaaS 및 하드웨어 대여 서비스를 출시한다고 해서, 하드웨어 판매를 전면 중단하는 것은 아니다. 황은 주로 스타트업이나 인프라를 간헐적으로만 사용하는 기업들은 대여를 선호하는 반면, 대기업은 자체 인프라 소유를 선호한다고 언급했다.

그는 AI 모델을 학습시키는 과정을 공장 운영에 비유하며, “엔비디아는 이제 공장 사업을 하고 있다. 미래에 가장 중요한 공장이다. 오늘날의 공장은 원자재를 들여와 제품을 내놓지만 미래의 공장은 데이터를 들여와 인텔리전스나 모델을 내놓게 될 것”이라고 말했다.

이어 황은 엔비디아가 하드웨어 및 소프트웨어 공장을 다양한 방식으로 제시해야 할 필요가 있다면서, “오늘날의 공장과 마찬가지로 어떤 사람들은 공장을 아웃소싱하고 싶어 하고, 어떤 사람들은 소유하는 쪽을 원한다. 어떤 비즈니스 모델인지에 달려 있을 뿐이다”라고 전했다. ciokr@idg.co.kr
 
추천 테크라이브러리

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.