Offcanvas

AI / 데이터센터 / 머신러닝|딥러닝 / 스토리지 / 통신|네트워크

‘대부분 데이터센터, 아직 AI 대비 안돼’… 슈나이더 일렉트릭 백서 공개

2023.10.04 Andy Patrizio  |  Network World
슈나이더 일렉트릭에 따르면 인공지능(AI) 프로세싱은 데이터센터의 표준 하드웨어 구성 요소보다 훨씬 더 많은 전력과 냉각 시스템을 필요로 한다.
 
ⓒ Getty Images Bank

슈나이더 일렉트릭(Schneider Electric)이 AI 데이터센터를 설계하는 지침을 담은 백서를 공개했다. 이에 따르면 AI의 전력 및 냉각 시스템 요구량은 표준 데이터센터 설계가 처리할 수 있는 수준을 넘어섰다. 슈나이더 일렉트릭은 이를 경고하며 새로운 설계의 필요성을 언급했다.

이는 슈나이더 일렉트릭과 같이 데이터센터용 전력 및 냉각 시스템을 만드는 회사라면 예상 가능한 일이다. 슈나이더의 의견이 틀렸다는 의미는 아니다. AI는 데이터베이스 같은 표준 서버 측 애플리케이션과는 워크로드 종류가 다르며, 기존 방식으로는 적합하지 않다.

슈나이더 백서에 따르면 AI에는 전력, 냉각, 대역폭 등 3가지 조건이 충분해야 한다. GPU는 가장 널리 사용되는 AI 프로세서이자 전력 집약적인 장치다. 인텔과 AMD의 CPU는 약 300~400와트를 소비하는 반면, 엔비디아의 최신 GPU는 프로세서당 700와트를 소비한다. 한 번에 8개 클러스터로 공급되는 경우가 많다.

전력 소비는 랙 밀도 증가로 이어진다. 과거 랙 밀도가 약 10~20kW였을 때는 공랭식 냉각(방열판과 팬)으로 쉽게 해결할 수 있었다. 하지만 랙당 30kW가 넘으면 공랭식 냉각으로는 온도를 낮추기 어렵다. 이때는 수랭식(액체) 냉각을 고려해야 한다. 다만 수랭식 냉각은 개조가 매우 어렵다.

백서 저자들은 “AI 스타트업, 대기업, 콜로케이션 제공업체, 인터넷 대기업은 이제 이러한 밀도가 데이터센터 물리적 인프라의 설계 및 관리에 미치는 영향을 고려해야 한다”라고 경고했다.

슈나이더는 올해 전 세계 데이터센터의 총 누적 전력 소비량이 54GW(gigawatt)에 달하고, 2028년에는 90GW에 달할 것으로 예상했다. AI 프로세싱은 올해 전체 전력 사용량의 8%에서 2028년 15~20%로 증가할 것으로 예상된다.

데이터센터 구축업체들이 전력과 냉각을 고려하는 동안 종종 간과하는 사항도 있다. 바로 네트워크 처리량과 연결성이다. AI 학습을 위해서는 각 GPU마다 처리량이 높은 자체 네트워크 포트가 필요하다.

하지만 GPU 성능은 네트워크 포트 수준을 크게 앞지르고 있다. 예를 들어 메모리에서 900Gbps로 데이터를 처리하는 GPU를 100Gbps 컴퓨팅 패브릭과 함께 사용하면, 네트워크가 데이터를 처리할 때까지 대기해야 하기 때문에 전체 GPU 속도는 느려지게 된다. 대신 인피니밴드(InfiniBand)를 활용할 수 있지만, 빠른 속도만큼 가격도 10배 이상 비싸다.

열 밀도를 줄이기 위해서는 하드웨어를 물리적으로 분산시키는 방법이 있다. 랙을 가득 채우지 않고 물리적으로 분리하는 방법이다. 하지만 이렇게 하면 이동해야 하는 테라바이트급 데이터가 많아지기 때문에 지연 시간이 발생한다. 지연 시간은 성능의 적이 될 수 있다.

제안 및 솔루션
슈나이더는 여러 제안 사항을 제시한다. 첫째는 고밀도 랙 내의 회로 수를 줄이기 위해 120/280V 배전을 240/415V 시스템으로 교체하는 방법이다. 적절한 전력을 공급하기 위해 여러 개의 전원 분배 장치(PDU) 사용을 권장한다.

둘째는 공랭식 냉각을 위해 랙당 20kW 임계값을 설정하는 방법이다. 20kW를 초과하는 경우 수랭식 냉각을 사용할 것을 슈나이더는 권장한다. 공랭식 냉각이 최대 30kW를 처리할 수 있다고 알려져 있기 때문에 슈나이더는 꽤 보수적인 태도를 취하고 있는 셈이다. 수랭식 냉각을 판매하려는 전략일 수도 있다.

수랭식 냉각에는 여러 형태가 있지만 슈나이더는 직접 액체 냉각(direct liquid cooling)을 권장한다. 공랭식 시스템과 마찬가지로 구리판이 CPU에 연결되지만, 2개의 파이프가 각각 물을 통해 열을 흡수하고 내보내며 순환 냉각하는 방식이다.

또 다른 수랭식 냉각 방식으로는 침수 냉각(immersion cooling)이 있으나 슈나이더는 이를 선호하지 않는 듯 보인다. 침수 냉각에 사용되는 액체 내 불소 탄소가 시스템을 오염시킬 가능성이 있기 때문이다.

일반적으로 수랭식 냉각에 대한 표준화가 부족한 상황이기 때문에, 슈나이더는 장비 경험이 풍부한 전문가를 통해 인프라를 철저하게 평가하는 과정이 중요하다고 언급했다. 다만 이는 애초에 개조 가능하도록 설계된 시설을 가정한다. 수랭식 냉각을 사용하는 대부분의 데이터센터는 센터를 설계할 때 이러한 인프라를 구축하는 것이며, 추후에 추가하기는 어렵다.

슈나이더 백서에는 이 밖에도 여러 권장 사항과 지침이 포함돼 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.