Offcanvas

AI / 데이터센터 / 서버

“패브렉스 기술로 32개 GPU를 한 서버에 결합”··· 기가아이오, 싱글노드 AI 슈퍼컴퓨터 출시

2023.07.28 Andy Patrizio  |  Network World
고성능 컴퓨팅(HPC) 시스템의 설치와 구성은 쉽지 않은 작업이다. 숙련된 IT 전문가가 소프트웨어 스택을 설정하고 까다로운 최적화 작업을 수행해야 한다. 쇼핑몰에서 구매한 부품으로 PC를 조립하는 것과는 차원이 다른 작업이다. AI 및 컴퓨팅 인프라 전문 벤더 기가아이오(GigaIO)가 이 작업을 단순화하고자 한다. 

기가아이오가 최근 32개의 GPU가 구성된 독립형 단일 노드 시스템을 발표했다. AI 및 슈퍼컴퓨팅 리소스의 간소화된 배포를 가능하게 한다는 설명이다.

지금까지 32개의 GPU를 활용하는 유일한 방법은 각각 8개의 GPU가 장착된 서버 4대를 구성하는 것이었다. 서버가 네트워킹 프로토콜을 통해 통신하기 때문에 지연 시간이 발생하고 모든 하드웨어가 상면 공간을 차지하게 된다.

슈퍼노드라고 불리는 기가아이오의 장치는 최대 32개의 AMD 인스팅트 MI210 GPU 또는 24개의 엔비디아 A100 GPU와 최대 1PB의 스토리지를 하나의 상용 서버에 선택할 수 있다는 점에서 주목할 만하다. MI210은 프론티어 엑사플롭 슈퍼컴퓨터에 사용되는 최고급 MI250 카드보다 성능이 한 단계 낮은 제품이다(적어도 현재로서는). 코어와 메모리가 다소 적으며, AMD의 라데온 GPU 기술을 기반으로 한다.

AMD의 기업 부사장 겸 데이터 센터 및 가속 처리 그룹 총괄 매니저인 앤드류 디크만은 성명에서 "기가아이오의 슈퍼노드 시스템은 전통적인 HPC 및 생성형 AI 워크로드 모두에 대해 매력적인 TCO를 제공한다"라고 평가했다.

슈퍼노드는 서버 시스템 메모리로부터의 지연 시간을 200ns로 줄여주는 메모리 중심 패브릭인 기가아이오의 패브렉스(FabreX) 커스텀 패브릭 기술을 기반으로 구축됐다. 이를 통한 패브렉스 4세대를 구현함으로써 최대 초당 512Gbits 대역폭까지 지원한다. 

패브렉스는 GPU, DPU, TPU, FPGA, SoC와 같은 가속기, NVMe, PCIe 네이티브 스토리지와 같은 저장 장치, 컴퓨팅 노드에 연결된 기타 I/O 리소스 등 다양한 리소스를 연결할 수 있다. 기본적으로 PCI 익스프레스 버스를 사용하는 모든 장치를 패브렉스에 연결하여 동일한 패브릭에서 장치 간 직접 통신을 구현하게 된다.

슈퍼노드에는 3가지 작동 모드가 있습니다. 많은 또는 모든 GPU를 최대한 활용하는 애플리케이션을 위한 비스트 모드, 모든 사용자가 처리 목적으로 사용할 수 있는 자신의 GPU를 얻는 프리스타일 모드, 애플리케이션이 여러 서버에서 실행되는 스웜 모드가 그것이다.

회사 측은 슈퍼노드가 파이토치나 텐서플로우와 같이 널리 사용되는 AI 프레임워크에서 작성된 기존 애플리케이션을 수정할 필요 없이 실행할 수 있다고 설명했다. 슈퍼노드는 엔비디아의 브라이트 클러스터 매니저 데이터 사이언스 소프트웨어를 사용해 환경을 관리 및 구성하고 스케줄링과 컨테이너 관리를 처리하게 된다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.