Offcanvas

AI / 비즈니스|경제 / 서버 / 신기술|미래

“인텔의 최근 혁신은 솔직히 지루했다"··· 겔싱어, 인텔 AI 로드맵 발표

2024.04.11 Lucas Mearian  |  Computerworld
인텔이 9일 비전 2024 컨퍼런스에서 엔터프라이즈 생성형 AI(genAI) 워크로드 가속화를 목표로 하는 가우디 3 프로세서를 공식 출시했다. 또 다양한 차세대 제품과 전략적 협업을 통해 생성형 AI 채택을 확대할 것이라고 발표했다.

이 칩 제조업체의 이번 전략은 하드웨어 및 클라우드 서비스 로드맵을 포괄한다. 데이터센터에서부터 AI PC와 같은 엣지 기기에 이르는 넓은 범위를 아우른다. 기조연설에서 인텔 CEO 팻 겔싱어는 먼저 신형 인텔 코어 울트라 프로세서 제품군을 사용하는 PC를 내장한 AI 시대를 예고했다. 그에 따르면 인텔은 2024년에 4,000만 대, 내년에는 1억 대의 AI PC 프로세서를 출하할 것으로 예상하고 있다.

지난 12월 인텔은 데이터센터 AI 워크로드를 위한 가우디 3 프로세서가 출시될 것을 예고하는 한편, 14세대 코어 울트라 ‘메테오 레이크’ 데이터센터 프로세서와 5세대 제온 스케일러블 CPU를 언급한 바 있다. 인텔은 지난 9일과 10일에 걸쳐 이들 제품군을 공식 발표했다.

인텔은 또한 차세대 그래나이트 릿지 및 시에라 포레스트 프로세서의 브랜드가 ‘제온 6’로 변경될 것이라고 발표했다. 


인텔 팻 겔싱어 CEO가 제온 6 웨이퍼를 들고 있다.

발표에 따르면 제온 6 프로세서는 FP16을 사용하는 4세대 제온에 비해 차세대 토큰 지연 시간을 최대 6.5배까지 단축하는 MXFP4 데이터 형식에 대한 소프트웨어 지원을 통합함으로써 700억 개의 파라미터를 가진 라마-2 대규모 언어 모델을 실행할 수 있다.

현장의 프레젠테이션에서 인텔은 가우디 3 아키텍처, 성능, 시장에 출시하기로 약속한 OEM에 대한 새로운 세부 정보를 제공하고 다수의 신규 고객을 소개했다. 대한민국의 네이버를 비롯해, 보쉬, 닐슨IQ, 시크르 등에 이르는 12곳의 “파트너 기업”이 자사의 가우디 3 가속기를 사용하고 있다고 인텔은 밝혔다.

그동안 AI 하드웨어 시장을 주도해온 기업은 엔비디아다. 대규모 언어 모델과 AI 애플리케이션을 구동하고 훈련하기 위해 개발된 GPU(그래픽 처리 장치)와 TPU(텐서 처리 장치)를 통해서다. 인텔은 가우디 3가 엔비디아의 H100 GPU의 직접적인 경쟁자라고 강조했다.

겔싱어는 가우디 3가 "훨씬 적은 비용으로" 엔비디아 H100에 비해 평균 50% 더 나은 추론 능력과 평균 40% 더 나은 전력 효율성을 제공한다고 말했다. 인텔에 따르면, 가우디 3 가속기는 BF16 부동 소수점 형식을 사용하는 컴퓨터 메모리 시스템에서 가우디 2에 비해 4배의 AI 컴퓨팅과 1.5배의 인메모리 대역폭을 제공할 수 있으며, 이전 버전에 비해 2배의 네트워킹 대역폭도 제공한다.

가우디 3는 TSMC의 5nm 공정을 사용하여 생산된다. 현재 델, HPE, 레노버, 슈퍼마이크로 등의 주문자 상표 부착 생산업체(OEM)를 대상으로 공급되고 있다. 이 칩은 데이터센터 내 랙에 수천 개의 다른 칩과 함께 배치되도록 설계됐다.

지난해 엔비디아는 데이터센터 칩 시장의 약 83%를 점유했으며, 나머지 17%의 대부분은 구글의 맞춤형 텐서 프로세싱 유닛(TPU)이었다.

한편 펜실베이니아 대학교 공학 및 응용과학대학의 교수인 벤자민 리는 인텔의 야심찬 전략에 대해 쉽지 않은 길이라고 평가하며, 엔비디아와 경쟁하기에는 어려움이 있다고 말했다. 그는 "인텔이 오랫동안 고성능 CPU의 설계와 제조를 지배해 왔다. 그러나 최근의 도전은 컴퓨팅 환경의 근본적인 변화를 반영한다. 데이터센터는 인터넷 서비스와 클라우드 컴퓨팅을 지원하기 위해 계속해서 CPU를 대량으로 필요로 할 것이다. 그러나 AI를 지원하기 위해 GPU를 점점 더 많이 배치되고 있다. 인텔은 경쟁력 있는 GPU를 설계하는 데 어려움을 겪고 있다”라고 말했다.

인텔의 고유한 장점은 최첨단 칩을 제조할 수 있는 유일한 미국 내 칩 제조 업체라는 점이다. 리 교수는 "팹리스인 엔비디아나 AMD와 같은 경쟁사에 비해 우위를 점할 수 있다. 하지만 인텔은 아직 TSMC와 같은 파운드리 사업을 안착시키지는 못했다. 현재 많은 기술 기업이 자체적으로 고성능 프로세서를 설계하고 있기 때문에 인텔의 파운드리 비즈니스는 인텔의 미래에 더욱 중요해질 것"이라고 말했다.

또한 인텔은 TSMC의 트랜지스터나 TSMC의 파운드리 공정에 필적하는 정밀도와 효율성을 따라잡지 못했다고 리는 말했다. 또한 큰 고객의 수요를 충족할 수 있는 제조 능력이 부족한 상태라고 그는 지적했다.

리 교수는 이어 겔싱어 CEO가 제시한 인텔의 로드맵은 합리적이지만 "CHIPS 법에 따른 새로운 연방 자금을 통해 전략을 효과적으로 실행할 수 있느냐는 것은 아직 해결되지 않은 문제"라고 지적했다.

2022년 8월, 미 의회는 코로나19 팬데믹으로 인해 드러난 프로세서 부족 문제를 해결하기 위해 칩스 및 과학법(CHIPS Act)을 통과시켰습니다. 이 법안은 반도체 연구, 개발 및 제조 분야에서 미국의 입지를 활성화하기 위한 조치를 담고 있다. 인텔은 총 527억 달러의 지원금 중 약 85억 달러를 지원받게 될 예정이다.

인텔의 겔싱어는 지난해 애리조나주 챈들러에 위치한 200억 달러 규모의 오코티요 제조 시설에서 인텔의 첫 번째 칩이 나올 수 있게 된 것은 CHIPS 법 덕분이라고 밝힌 바 있다. 

제온 6를 비롯한 차세대 제품군 정보
인텔은 비전 컨퍼런스에서 차세대 제품 및 서비스에 대한 정보를 공개했다. 여기에는 ‘검색 증강 생성’(RAG) 프로세스를 실행할 수 있는 새로운 인텔 제온 6 프로세서에 대한 내용도 포함돼 있다. 

RAG는 조직의 독점 데이터와 정보를 사용하여 보다 맞춤화되고 정확한 생성형 AI 모델을 생성함으로써 잘못된 출력 및 환각과 같은 알려진 AI 문제를 크게 줄일 수 있는 것으로 전해진다. 

겔싱어는 생성형 AI가 실시간으로 업데이트되지 않는 인터넷에서 취합한 데이터를 사용하며, 이로 인해 신뢰할 수 없다는 점을 설명했다. 그는 "잘해봤자 일주일에 한 번, 한 달에 한 번 정도 업데이트하고 재교육할 수도 있지 않을까? 벡터 데이터베이스를 통해 들어오는 실시간 데이터와 스트리밍 비정형 데이터베이스를 결합하고 이 두 가지를 실시간으로 함께 가져올 때 [LLM]은 매우 강력하다고 본다"라고 말했다.

인텔은 또한 이번 분기에 데이터센터, 클라우드 및 엣지 용도의 차세대 프로세서를 위한 새로운 브랜드를 출시할 예정이라고 밝혔습니다. 인텔 제온 6 프로세서는 2세대 인텔 제온 프로세서 대비 최대 2.4배의 와트당 성능과 2.7배의 랙 밀도를 제공하는 효율적인 코어(E-core - 이전 코드명 시에라 포레스트)를 탑재할 예정다. 

그는 인텔의 지난 10년간의 혁신에 대해 ‘평범’하라는 표현을 사용했다. PCIe를 조금 더 빠르게 만들고, DDR 메모리를 점진적으로 업그레이드했으며 코어를 몇 개 더 추가한 수준이었다는 설명이다.

겔싱어는 "사실 지루했다. 하지만 AI가 모든 것을 흥미진진하게 만들고 있다. 컴퓨팅이 나아가고 있는 근본적인 방향은 인터넷 이후 가장 큰 기술 변화이며, 우리 비즈니스와 여러분의 비즈니스의 모든 측면을 재편할 것이다"라고 말했다.

이 밖에 그는 반도체 전체 주소 지정 가능 시장이 현재 6,000억 달러에서 10년이 지나면 1조 달러 이상으로 성장할 것으로 예상했다. 이에 대응해 올해 말 차세대 코어 울트라 클라이언트 프로세서 제품군(코드명 루나 레이크)을 출시할 예정이라고 발표했다. 이 프로세서는 차세대 AI PC를 위해 초당 100회 이상의 플랫폼 테라 연산(TOPS)과 45회 이상의 신경 처리 장치(NPU) TOPS를 제공할 예정이다.

겔싱어는 애리조나주 피닉스의 강당에서 "인텔은 AI를 모든 곳에 제공한다는 사명을 가지고 있다. 나는 다음 플랫폼에 대해 상당히 기대하고 있다. 경쟁사들이 첫 번째 [AI] 칩을 출시하기 전에 우리는 3배 더 뛰어난 AI 성능을 갖춘 두 번째 플랫폼인 루나레이크를 출시할 예정이다. 그리고 3세대는 [제작] 단계에 있다"라고 말했다.

겔싱어는 AI 지원 PC를 와이파이 기능성에 비유했다. AI 기능이 없는 PC가 시대에 뒤떨어진 것으로 간주될 날이 온다는 이야기다. 그는 "마이크로소프트 코파일럿, AI 개발자, 줌 및 팀즈 요약, 번역, 문맥화를 생각해보라. 애플리케이션이 AI로 변신하고 있다. 놓치면 안 된다. 간단히 말해, PC를 새로 고쳐야 할 때다"라고 말했다.

인텔은 또한 AI 패브릭을 위한 개방형 이더넷 네트워킹 모델을 만들기 위해 노력하고 있다며, 다양한 AI에 최적화된 이더넷 솔루션을 소개했다. 울트라 이더넷 컨소시엄(UEC)을 통해 대규모 스케일업 및 스케일아웃 AI 패브릭을 설계하기 위해 노력하고 있음을 언급하기도 했다.

인텔은 성명에서 "이러한 혁신을 통해 점점 더 방대한 모델에 대한 훈련과 추론이 가능하며, 그 규모는 매 세대마다 엄청난 규모로 확장되고 있다 이 라인업에는 인텔 AI NIC(네트워크 인터페이스 카드), XPU에 통합하기 위한 AI 연결 칩렛, 가우디 기반 시스템, 인텔 파운드리를 위한 다양한 소프트 및 하드 참조 AI 인터커넥트 설계가 포함된다"라고 밝혔다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.