Offcanvas

AI / 데이터센터 / 머신러닝|딥러닝 / 서버

냉각, 전력까지 총체적 부족하다··· 생성형 AI 대비 시급한 데이터센터

2023.07.31 Bob Violino  |  Network World
프롬프트에 응답해 텍스트, 이미지 또는 기타 미디어를 생성할 수 있는 생성형 AI의 기업 도입은 아직 초기 단계이다. 하지만 기업이 이 기술의 새로운 용도를 찾아내면 빠르게 확산될 것으로 보인다.

가트너의 애널리스트 프란시스 카라모지스는 "생성형 AI 열풍은 수그러들 기미가 보이지 않는다"며, "기업은 생성형 AI 솔루션에 얼마나 많은 자금을 투입할지, 어떤 제품이 투자할 가치가 있는지, 언제 시작할지, 이 새로운 기술과 함께 발생하는 위험을 어떻게 완화할지 결정하기 위해 분주하게 움직이고 있다"고 말했다.
 
ⓒ Getty Images Bank

블룸버그 인텔리전스는 생성형 AI 시장이 향후 10년간 매년 42%씩 성장해 2022년 400억 달러에서 1조 3,000억 달러에 달할 것으로 전망하기도 했다.

생성형 AI는 소프트웨어 코드 및 네트워킹 스크립트 작성, 문제 해결 및 이슈 해결, 프로세스 자동화, 교육 및 온보딩 제공, 문서 및 지식 관리 시스템 생성, 프로젝트 관리 및 계획 지원 등 다양한 방식으로 IT 부서를 지원할 수 있다. 또한 콜센터, 고객 서비스, 가상 비서, 데이터 분석, 콘텐츠 제작, 디자인 및 개발, 예측 유지보수 등 비즈니스의 다양한 영역을 혁신할 수 있다.

하지만 데이터센터 인프라가 생성형 AI로 인해 증가하는 워크로드를 처리할 수 있는지 확인해야 한다.
 

컴퓨팅 요구 사항에 대한 생성형 AI의 영향

생성형 AI가 앞으로 대부분 기업에서 데이터 전략의 일부가 될 것이라는 데는 의심의 여지가 없다. 따라서 IT 책임자라면 IT 인프라가 다가오는 변화에 대비할 수 있도록 해야 한다. 

그렇다면, 생성형 AI를 통합한 애플리케이션의 구축과 배치는 컴퓨팅 성능 및 기타 자원에 어떤 영향을 미칠까? 컨설팅 회사 KPMG의 고문 브라이언 루이스는 "오늘날 우리가 알고 있는 데이터센터에 대한 수요는 증가할 것이며, 데이터센터와 관련 기술의 미래 모습은 크게 달라질 것"이라고 강조했다.

생성형 AI 애플리케이션은 생성형 AI 시스템의 핵심을 구성하는 대규모 언어 모델(LLM)을 학습하고, 학습된 LLM으로 애플리케이션을 운영하는 두 단계에 걸쳐 상당한 컴퓨팅 성능을 필요로 한다. 데이터센터 운영업체 데이터뱅크의 CEO 라울 마티넥은 "LLM을 학습하려면 신경망 형태의 고밀도 컴퓨팅이 필요한데, 수십억 개의 언어 또는 이미지 예제를 신경망 시스템에 공급하고 시스템이 사람처럼 '인식'할 때까지 반복적으로 개선해야 한다"라고 설명했다.

신경망에는 한 번에 몇 달 또는 몇 년 동안 지속적으로 실행되는 초고밀도 GPU 클러스터가 필요하다. 마티넥은 "신경망은 훈련에 사용되는 전용 데이터 세트와 가까운 곳에 위치한 전용 인프라에서 더 효율적으로 실행할 수 있다"고 덧붙였다. 

두 번째는 '추론 프로세스' 또는 이런 애플리케이션을 사용해 실제로 쿼리를 수행하고 데이터 결과를 반환하는 단계이다. 마티넥은 "운영 단계에서는 정보를 쿼리하는 사용자가 빠른 응답을 원하기 때문에 신속하게 확장할 수 있고 애플리케이션에 대한 지연없는 액세스를 제공해야 한다. 따라서 지리적으로 더 분산된 인프라가 필요하다"고 설명했다. 

이를 위해서는 현재 대부분 애플리케이션을 지원하는 중앙 집중식 퍼블릭 클라우드 모델과 달리 여러 위치에 데이터센터가 있어야 한다. 이 단계에서도 데이터센터 컴퓨팅 성능에 대한 수요는 여전히 높지만, 이런 수요가 더 많은 데이터센터에 분산된다.
 

수랭 시스템 수요를 유발하는 생성형 AI

IT 책임자는 생성형 AI가 서버 밀도에 미치는 영향과 함께 냉각 요구 사항, 전력 수요, 지속 가능성 과제 등에 미치는 영향도 고려해야 한다.


티리아스 리서치의 대표 애널리스트 프란시스 시데코는 "밀도뿐만 아니라 최대 부하에서 서버가 얼마나 자주, 얼마나 많이 사용되는지에 대한 주기도 중요하다"고 지적했다. 엔비디아나 AMD, 인텔 같은 업체는 각 세대의 AI 칩을 통해 전력과 발열을 제어하면서 성능을 높이기 위해 노력하고 있다. 하지만 이런 노력에도 불구하고 전력 예산은 여전히 증가하고 있다. 시데코는 "특히 생성형 AI를 중심으로 워크로드가 빠르게 증가하고 있기 때문에 언젠가는 한계에 부딪힐 것"이라고 지적했다.

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.