2020.11.02

‘엔비디아’가 애플리케이션 생태계를 확장하고 있다··· 그 전략은?

James Kobielus | InfoWorld
엔비디아(Nvidia)가 AI와 게임을 넘어 사업 영역을 확대하고 있다. 모빌리티와 차세대 클라우드 데이터센터로 과감하게 진출하면서 전체 컴퓨팅 생태계를 광범위하게 아우르고자 하는 것이다. 

이와 관련한 엔비디아의 야망은 임박한 ARM 테크놀로지 인수 그리고 CEO 젠슨 황이 엔비디아를 ‘종합 컴퓨팅(full-stack computing)’ 제공업체로 포지셔닝한 것에서 분명하게 드러난다. 

지난 10월에 열린 GTC 2020(Nvidia GPU Technology Conference)에서 젠슨 황은 이 비전을 위해 R&D에 상당한 투자를 하고 있으며, 새로운 블루필드 ‘데이터 프로세싱 유닛(Data Processing Unit, DPU)’ 칩 아키텍처를 출시한다고 발표했다. 
 
ⓒNvidia

프로그래밍 할 수 있는 CPU 오프로드를 통해 다양한 워크로드 가속화
전략적으로 볼 때, ‘블루필드 DPU’는 엔비디아가 과감하게 진행한 최근 2건의 인수를 바탕으로 한다. 이 새로운 하드웨어 아키텍처는 ARM의 CPU 아키텍처에서 실행된다. 또한 엔비디아가 지난 4월 인수한 ‘멜라녹스(Mellanox)’의 고속 인터커넥트 기술을 통합했다. 

GPU 중심의 제품 아키텍처를 넘어선 진화를 상징하는 이 새로운 DPU 아키텍처는 고성능 멀티코어 SoC(System on Chip)다. 다시 말해, 블루필드 DPU는 광범위한 AI, 네트워킹, 가상화, 보안, 스토리지 및 기타 엔터프라이즈 워크로드를 고속 처리할 수 있는 프로그래밍 가능한 프로세서다. 

또한 서버 기반 지능형 네트워크 인터페이스 컨트롤러(Network Interface Controller, NIC)의 기반으로써 DPU는 CPU 워크로드를 오프로드하는 동시에 대용량 데이터를 회선 속도로 그리고 효율적으로 분석, 처리, 전송한다. 

CPU 오프로드 가속화라는 이점 외에도, DPU는 데이터센터 보안을 강화할 수 있다. 탑재된 ARM 코어가 보안 서비스와 CPU 실행 애플리케이션 사이에 보안 계층을 추가하기 때문이다. 

한편 GTC 2020에서 발표된 DPU SoC 제품군의 차기 로드맵은 다음과 같다. 

엔비디아 블루필드-2(Nvidia BlueField-2): 2021년 엔비디아 서버 하드웨어 파트너가 제공하는 새 시스템에 포함될 예정인 이 아키텍처는 엔비디아 멜라녹스 커넥트X-6 Dx SmartNIC(ConnectX-6 Dx SmartNIC)의 모든 기능을 갖추고 있다. 

이는 프로그래밍 할 수 있는 ARM 코어를 통합하고, 200Gbps의 데이터 전송 속도를 지원하며, 하드웨어 오프로드를 제공해 핵심 데이터센터 작업을 가속화한다.

또한 보안, 네트워킹, 스토리지 작업 속도를 높인다. 이를테면 격리, 루트 트러스트, 키 관리, 컨버지드 이더넷 상의 RDMA, GPU다이렉트, 탄력적 블록 스토리지, 데이터 압축 등이다. 아울러 고성능 백엔드 비휘발성 메모리 익스프레스 스토리지, 올-플래시 어레이, 하이퍼컨버지드 시스템을 관리하는 컨트롤러가 포함돼 있다. 

회사에 따르면 단일 블루필드-2 DPU는 최대 125개 CPU 코어에서 데이터센터 워크로드를 오프로드할 수 있으므로 다른 엔터프라이즈 애플리케이션을 처리할 사이클을 확보할 수 있다. 

엔비디아 블루필드-2X(Nvidia BlueField-2X): 현재 개발 중인 이 아키텍처는 2021년 출시될 예정이다. 이는 엔비디아 암페어(Nvidia Ampere) 아키텍처 GPU를 블루필드-2에 추가해 쿠다(CUDA) 및 엔비디아 AI(Nvidia AI)와의 인네트워킹 컴퓨팅을 지원한다. 

이는 블루필드-2의 핵심 기능을 모두 포함하고 있으며, 엔비디아 3세대 텐서 코어(Tensor Cores)를 활용해 실시간 AI 주도 보안 애널리틱스를 제공한다. 예를 들면 기밀 데이터 탈취를 의미하는 비정상 트래픽을 식별하고, 회선 속도로 트래픽 애널리틱스를 암호화하며, 트래픽 검사로 악의적 활동을 파악한다. 또 보안 기능을 자동으로 트리거하거나 자동화된 대응 등을 제공한다. 
 
또한 엔비디아는 2022년에는 차세대 블루필드-3와 블루필드-3X를, 2023년에는 블루필드-4X를 선보일 예정이라고 발표했다. 후속 세대에서 엔비디아는 GPU와 ARM 코어를 실리콘 수준에서 통합할 계획이다. 블루필드-4는 DPU 처리 속도가 블루필드-2X보다 1,000배, 블루필드-3X보다는 600배 더 빠를 것이라고 회사 측은 전했다. 

DPU 가속기 아키텍처를 중심으로 구축하는 견고한 생태계 
엔비디아는 자사의 하드웨어 플랫폼을 DPU 중심의 아키텍처로 진화시키면서 새로운 엔터프라이즈 애플리케이션을 지원하고, 나아가 블루필드/DOCA 가속기를 ARM 파트너 생태계에 완벽히 통합하려고 하고 있다. 

GTC 2020에서 엔비디아는 ARM 파트너가 GPU 지원은 물론 DPU 지원 네트워킹, 스토리지, 보안 기술로 구성된 ‘종합 솔루션 플랫폼’으로 시장에 진출하도록 지원하겠다고 설명했다. 

또한 엔비디아는 ARM 파트너와 협력해 고성능 컴퓨팅, 엣지, PC를 지원하는 종합 솔루션을 개발했다. 게다가 자사의 AI 및 RTX 엔진을 ARM에 이식해 x86 플랫폼보다 훨씬 더 큰 시장을 공략하고 있다. 

새로운 DPU 제품군에서 AI보다 더 광범위한 엔터프라이즈 애플리케이션 워크로드를 지원하려는 엔비디아의 계획에 파트너는 매우 중요하다. 무엇보다 엔비디아의 ‘확대’ 전략에는 ‘DOCA’도 필수적이다. DOCA는 새로운 데이터센터 인프라 SoC 아키텍처이자 소프트웨어 개발 키트다. 

현재 초기 액세스 파트너에게만 제공되는 DOCA SDK를 사용하면 개발자가 블루필드-가속 데이터센터 인프라에서 애플리케이션을 프로그래밍할 수 있다. 개발자는 또한 CPU 워크로드를 블루필드 DPU로 오프로드할 수 있다. 

결과적으로, DOCA는 GPU 가속 애플리케이션 개발을 가능하게 하는 쿠다(CUDA) 프로그래밍 모델을 보완하면서 엔비디아의 엔터프라이즈 개발자 도구를 강화한다. 

나아가 해당 SDK는 컨테이너화된 소프트웨어 엔비디아 NGC(Nvidia NGC) 카탈로그에 완벽히 통합돼 서드파티 애플리케이션 업체가 DPU 가속 애플리케이션을 개발하고 인증하며 배포하도록 장려한다. 

여러 주요 소프트웨어 업체(VM웨어(VMware), 레드햇(Red Hat), 캐노니컬(Canonical), 체크 포인트 소프트웨어 테크놀로지스(Check Point Software Technologies))는 내년에 자사 소프트웨어와 새로운 DSP/DOCA 가속 아키텍처를 통합할 계획이라고 발표했다. 

또한 엔비디아는 에이수스(Asus), 아토스(Atos), 델 데크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(Gigabyte), H3C, 인스퍼(Inspur), 레노버(Lenovo), 콴타/QCT(Quanta/QCT), 슈퍼마이크로(Supermicro) 등의 주요 서버 제조사도 마찬가지로 내년에 DPU를 자체 제품에 통합할 예정이라고 밝혔다. 

비록 ‘클라우드 기반 마이크로소프트 오피스 경험에 GPU 가속 스마트 경험을 제공하기 위해 마이크로소프트가 애저에서 엔비디아 AI를 채택하고 있다’라는 젠슨 황의 발표와 ARM 간의 구체적인 연계는 없었지만 언젠가 DPU-오프로드 기술을 활용해 오피스 앱의 모바일 경험이 로컬에서 가속화된다고 해도 놀랄 만한 일은 아닐 것이다. 

엔비디아 솔루션, GPU 중심 기능 의존도를 줄이다  
엔비디아의 제품팀은 DPU의 CPU 오프로드 가속화를 자사 솔루션에 거침없이 통합하고 있다. 가장 주목할 만한 점은 엔비디아 EGX AI 엣지 서버 플랫폼(Nvidia EGX AI edge-server platform)이 단일 PCIe 카드에 엔비디아 암페어 아키텍처 GPU와 블루필드-2 DPU를 결합하도록 진화하고 있다는 것이다. 

물론 AI 로보틱스용 ARM 기반 SoC ‘엔비디아 젯슨(Nvidia Jetson)’과 블루필드 DPU와의 구체적인 연계는 없었지만, DOCA SDK가 이들 애플리케이션의 개발을 지원하는 방향으로 발전하리라 예상하기는 어렵지 않다. 이는 엔비디아의 핵심 플랫폼이 강력하게 성장하는 분야이기 때문이다. 

또한 실시간 3D 콘텐츠 협업 플랫폼 '옴니버스(Omniverse)', 대화형 AI 서비스 구축을 지원하는 프레임워크 '자비스(Jarvis)', 클라우드 기반 AI 동영상 스트리밍 플랫폼 '맥신(Maxine)'을 가속화하는 데 새로운 하드웨어와 SDK를 사용할 것이라는 점도 합리적으로 예측할 수 있다.

모멘텀은 유지될 것 
엔비디아의 새로운 블루필드 DPU 아키텍처와 DOCA SDK는 모든 유형의 기업, 서비스 제공업체, 소비자로 기업의 도달 범위를 넓힐 수 있는 전략적 플랫폼을 제공한다. 

DPU 아키텍처는 각종 워크로드의 하드웨어 가속 CPU 오프로드를 지원해 엔비디아가 새로운 DOCA 프로그래밍 모델을 쿠다(CUDA) AI 개발 프레임워크 및 컨테이너화된 클라우드 솔루션의 NGC 카탈로그와 통합할 수 있는 명확한 경로를 제시한다. 

이제 엔비디아는 클라우드부터 엣지까지 다양한 애플리케이션 및 인프라 워크로드를 가속화하는 데 필요한 하드웨어 및 소프트웨어 플랫폼을 자체 제품팀과 솔루션 파트너에게 제공할 수 있다. 

ARM 테크놀로지 인수 최종 승인을 기다리고 있는 엔비디아는 기존 파트너 생태계에서 이 새로운 아키텍처를 입증해야 한다. 만약 DPU 기술이 기대에 미치지 못한다면 이는 ARM의 방대한 라이선스 사용자 집단과의 관계를 틀어지게 만들 수 있다. 이들은 모두 CPU 기반 프로세스 아키텍처에 크게 의존하고 있으며, 업계 선도적인 엔비디아 AI 기술과 원활한 통합이라는 이점을 누리고 있기 때문이다. 

한 가지 분명한 점은, 엔비디아가 ‘클라우드-투-엣지 마이크로프로세서’ 경쟁에서 모멘텀을 잃지 않으리라는 것이다. 최대 라이벌이자 CPU 강자인 인텔(Intel)을 추월하기 시작한 지금이라면 특히 그렇다. ciokr@idg.co.kr
 



2020.11.02

‘엔비디아’가 애플리케이션 생태계를 확장하고 있다··· 그 전략은?

James Kobielus | InfoWorld
엔비디아(Nvidia)가 AI와 게임을 넘어 사업 영역을 확대하고 있다. 모빌리티와 차세대 클라우드 데이터센터로 과감하게 진출하면서 전체 컴퓨팅 생태계를 광범위하게 아우르고자 하는 것이다. 

이와 관련한 엔비디아의 야망은 임박한 ARM 테크놀로지 인수 그리고 CEO 젠슨 황이 엔비디아를 ‘종합 컴퓨팅(full-stack computing)’ 제공업체로 포지셔닝한 것에서 분명하게 드러난다. 

지난 10월에 열린 GTC 2020(Nvidia GPU Technology Conference)에서 젠슨 황은 이 비전을 위해 R&D에 상당한 투자를 하고 있으며, 새로운 블루필드 ‘데이터 프로세싱 유닛(Data Processing Unit, DPU)’ 칩 아키텍처를 출시한다고 발표했다. 
 
ⓒNvidia

프로그래밍 할 수 있는 CPU 오프로드를 통해 다양한 워크로드 가속화
전략적으로 볼 때, ‘블루필드 DPU’는 엔비디아가 과감하게 진행한 최근 2건의 인수를 바탕으로 한다. 이 새로운 하드웨어 아키텍처는 ARM의 CPU 아키텍처에서 실행된다. 또한 엔비디아가 지난 4월 인수한 ‘멜라녹스(Mellanox)’의 고속 인터커넥트 기술을 통합했다. 

GPU 중심의 제품 아키텍처를 넘어선 진화를 상징하는 이 새로운 DPU 아키텍처는 고성능 멀티코어 SoC(System on Chip)다. 다시 말해, 블루필드 DPU는 광범위한 AI, 네트워킹, 가상화, 보안, 스토리지 및 기타 엔터프라이즈 워크로드를 고속 처리할 수 있는 프로그래밍 가능한 프로세서다. 

또한 서버 기반 지능형 네트워크 인터페이스 컨트롤러(Network Interface Controller, NIC)의 기반으로써 DPU는 CPU 워크로드를 오프로드하는 동시에 대용량 데이터를 회선 속도로 그리고 효율적으로 분석, 처리, 전송한다. 

CPU 오프로드 가속화라는 이점 외에도, DPU는 데이터센터 보안을 강화할 수 있다. 탑재된 ARM 코어가 보안 서비스와 CPU 실행 애플리케이션 사이에 보안 계층을 추가하기 때문이다. 

한편 GTC 2020에서 발표된 DPU SoC 제품군의 차기 로드맵은 다음과 같다. 

엔비디아 블루필드-2(Nvidia BlueField-2): 2021년 엔비디아 서버 하드웨어 파트너가 제공하는 새 시스템에 포함될 예정인 이 아키텍처는 엔비디아 멜라녹스 커넥트X-6 Dx SmartNIC(ConnectX-6 Dx SmartNIC)의 모든 기능을 갖추고 있다. 

이는 프로그래밍 할 수 있는 ARM 코어를 통합하고, 200Gbps의 데이터 전송 속도를 지원하며, 하드웨어 오프로드를 제공해 핵심 데이터센터 작업을 가속화한다.

또한 보안, 네트워킹, 스토리지 작업 속도를 높인다. 이를테면 격리, 루트 트러스트, 키 관리, 컨버지드 이더넷 상의 RDMA, GPU다이렉트, 탄력적 블록 스토리지, 데이터 압축 등이다. 아울러 고성능 백엔드 비휘발성 메모리 익스프레스 스토리지, 올-플래시 어레이, 하이퍼컨버지드 시스템을 관리하는 컨트롤러가 포함돼 있다. 

회사에 따르면 단일 블루필드-2 DPU는 최대 125개 CPU 코어에서 데이터센터 워크로드를 오프로드할 수 있으므로 다른 엔터프라이즈 애플리케이션을 처리할 사이클을 확보할 수 있다. 

엔비디아 블루필드-2X(Nvidia BlueField-2X): 현재 개발 중인 이 아키텍처는 2021년 출시될 예정이다. 이는 엔비디아 암페어(Nvidia Ampere) 아키텍처 GPU를 블루필드-2에 추가해 쿠다(CUDA) 및 엔비디아 AI(Nvidia AI)와의 인네트워킹 컴퓨팅을 지원한다. 

이는 블루필드-2의 핵심 기능을 모두 포함하고 있으며, 엔비디아 3세대 텐서 코어(Tensor Cores)를 활용해 실시간 AI 주도 보안 애널리틱스를 제공한다. 예를 들면 기밀 데이터 탈취를 의미하는 비정상 트래픽을 식별하고, 회선 속도로 트래픽 애널리틱스를 암호화하며, 트래픽 검사로 악의적 활동을 파악한다. 또 보안 기능을 자동으로 트리거하거나 자동화된 대응 등을 제공한다. 
 
또한 엔비디아는 2022년에는 차세대 블루필드-3와 블루필드-3X를, 2023년에는 블루필드-4X를 선보일 예정이라고 발표했다. 후속 세대에서 엔비디아는 GPU와 ARM 코어를 실리콘 수준에서 통합할 계획이다. 블루필드-4는 DPU 처리 속도가 블루필드-2X보다 1,000배, 블루필드-3X보다는 600배 더 빠를 것이라고 회사 측은 전했다. 

DPU 가속기 아키텍처를 중심으로 구축하는 견고한 생태계 
엔비디아는 자사의 하드웨어 플랫폼을 DPU 중심의 아키텍처로 진화시키면서 새로운 엔터프라이즈 애플리케이션을 지원하고, 나아가 블루필드/DOCA 가속기를 ARM 파트너 생태계에 완벽히 통합하려고 하고 있다. 

GTC 2020에서 엔비디아는 ARM 파트너가 GPU 지원은 물론 DPU 지원 네트워킹, 스토리지, 보안 기술로 구성된 ‘종합 솔루션 플랫폼’으로 시장에 진출하도록 지원하겠다고 설명했다. 

또한 엔비디아는 ARM 파트너와 협력해 고성능 컴퓨팅, 엣지, PC를 지원하는 종합 솔루션을 개발했다. 게다가 자사의 AI 및 RTX 엔진을 ARM에 이식해 x86 플랫폼보다 훨씬 더 큰 시장을 공략하고 있다. 

새로운 DPU 제품군에서 AI보다 더 광범위한 엔터프라이즈 애플리케이션 워크로드를 지원하려는 엔비디아의 계획에 파트너는 매우 중요하다. 무엇보다 엔비디아의 ‘확대’ 전략에는 ‘DOCA’도 필수적이다. DOCA는 새로운 데이터센터 인프라 SoC 아키텍처이자 소프트웨어 개발 키트다. 

현재 초기 액세스 파트너에게만 제공되는 DOCA SDK를 사용하면 개발자가 블루필드-가속 데이터센터 인프라에서 애플리케이션을 프로그래밍할 수 있다. 개발자는 또한 CPU 워크로드를 블루필드 DPU로 오프로드할 수 있다. 

결과적으로, DOCA는 GPU 가속 애플리케이션 개발을 가능하게 하는 쿠다(CUDA) 프로그래밍 모델을 보완하면서 엔비디아의 엔터프라이즈 개발자 도구를 강화한다. 

나아가 해당 SDK는 컨테이너화된 소프트웨어 엔비디아 NGC(Nvidia NGC) 카탈로그에 완벽히 통합돼 서드파티 애플리케이션 업체가 DPU 가속 애플리케이션을 개발하고 인증하며 배포하도록 장려한다. 

여러 주요 소프트웨어 업체(VM웨어(VMware), 레드햇(Red Hat), 캐노니컬(Canonical), 체크 포인트 소프트웨어 테크놀로지스(Check Point Software Technologies))는 내년에 자사 소프트웨어와 새로운 DSP/DOCA 가속 아키텍처를 통합할 계획이라고 발표했다. 

또한 엔비디아는 에이수스(Asus), 아토스(Atos), 델 데크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(Gigabyte), H3C, 인스퍼(Inspur), 레노버(Lenovo), 콴타/QCT(Quanta/QCT), 슈퍼마이크로(Supermicro) 등의 주요 서버 제조사도 마찬가지로 내년에 DPU를 자체 제품에 통합할 예정이라고 밝혔다. 

비록 ‘클라우드 기반 마이크로소프트 오피스 경험에 GPU 가속 스마트 경험을 제공하기 위해 마이크로소프트가 애저에서 엔비디아 AI를 채택하고 있다’라는 젠슨 황의 발표와 ARM 간의 구체적인 연계는 없었지만 언젠가 DPU-오프로드 기술을 활용해 오피스 앱의 모바일 경험이 로컬에서 가속화된다고 해도 놀랄 만한 일은 아닐 것이다. 

엔비디아 솔루션, GPU 중심 기능 의존도를 줄이다  
엔비디아의 제품팀은 DPU의 CPU 오프로드 가속화를 자사 솔루션에 거침없이 통합하고 있다. 가장 주목할 만한 점은 엔비디아 EGX AI 엣지 서버 플랫폼(Nvidia EGX AI edge-server platform)이 단일 PCIe 카드에 엔비디아 암페어 아키텍처 GPU와 블루필드-2 DPU를 결합하도록 진화하고 있다는 것이다. 

물론 AI 로보틱스용 ARM 기반 SoC ‘엔비디아 젯슨(Nvidia Jetson)’과 블루필드 DPU와의 구체적인 연계는 없었지만, DOCA SDK가 이들 애플리케이션의 개발을 지원하는 방향으로 발전하리라 예상하기는 어렵지 않다. 이는 엔비디아의 핵심 플랫폼이 강력하게 성장하는 분야이기 때문이다. 

또한 실시간 3D 콘텐츠 협업 플랫폼 '옴니버스(Omniverse)', 대화형 AI 서비스 구축을 지원하는 프레임워크 '자비스(Jarvis)', 클라우드 기반 AI 동영상 스트리밍 플랫폼 '맥신(Maxine)'을 가속화하는 데 새로운 하드웨어와 SDK를 사용할 것이라는 점도 합리적으로 예측할 수 있다.

모멘텀은 유지될 것 
엔비디아의 새로운 블루필드 DPU 아키텍처와 DOCA SDK는 모든 유형의 기업, 서비스 제공업체, 소비자로 기업의 도달 범위를 넓힐 수 있는 전략적 플랫폼을 제공한다. 

DPU 아키텍처는 각종 워크로드의 하드웨어 가속 CPU 오프로드를 지원해 엔비디아가 새로운 DOCA 프로그래밍 모델을 쿠다(CUDA) AI 개발 프레임워크 및 컨테이너화된 클라우드 솔루션의 NGC 카탈로그와 통합할 수 있는 명확한 경로를 제시한다. 

이제 엔비디아는 클라우드부터 엣지까지 다양한 애플리케이션 및 인프라 워크로드를 가속화하는 데 필요한 하드웨어 및 소프트웨어 플랫폼을 자체 제품팀과 솔루션 파트너에게 제공할 수 있다. 

ARM 테크놀로지 인수 최종 승인을 기다리고 있는 엔비디아는 기존 파트너 생태계에서 이 새로운 아키텍처를 입증해야 한다. 만약 DPU 기술이 기대에 미치지 못한다면 이는 ARM의 방대한 라이선스 사용자 집단과의 관계를 틀어지게 만들 수 있다. 이들은 모두 CPU 기반 프로세스 아키텍처에 크게 의존하고 있으며, 업계 선도적인 엔비디아 AI 기술과 원활한 통합이라는 이점을 누리고 있기 때문이다. 

한 가지 분명한 점은, 엔비디아가 ‘클라우드-투-엣지 마이크로프로세서’ 경쟁에서 모멘텀을 잃지 않으리라는 것이다. 최대 라이벌이자 CPU 강자인 인텔(Intel)을 추월하기 시작한 지금이라면 특히 그렇다. ciokr@idg.co.kr
 

X