Offcanvas

AI / CIO / IoT / 데이터센터 / 비즈니스|경제 / 서버 / 신기술|미래 / 통신|네트워크

PC·스마트폰·자동차 찍고 확장 또 확장··· 생성형 AI, 데이터센터를 벗어나다

2024.01.31 Lucas Mearian  |  Computerworld
챗GPT와 같은 생성형 인공지능은 지금까지 대부분 대규모 데이터센터에 둥지를 틀고 있었다. 기업이 생성형 AI 서비스를 사용하고자 할 때는 기본적으로 마이크로소프트 365 코파일럿과 같은 AI 플랫폼에 대한 액세스 권한을 구매하는 형태였다.

클라우드 기반 시스템의 문제점은 외부 데이터센터에의 의존성이다. 이로 인해 기업 고유의 데이터와 관련된 보안 문제와 네트워크 연결성 문제가 나타날 수 있다. 이에 더해 생성형 AI 영역은 훈련 및 실행에 필요한 특수 프로세서의 부족에 직면해 있다.

비즈니스 컨설팅 기업 J. 골드 어쏘시에이츠의 잭 골드 수석 애널리스트와 여타 애널리스트들에 따르면, 엣지 디바이스에 생성형 AI 작업 처리를 적용하는 것이 해법일 수 있다. 실리콘 제조업체들이 PC, 태블릿, 스마트 폰, 심지어는 자동차에 관심을 돌리고 있는 이유도 바로 여기에 있다. 
 
"클라우드로 보내고 싶지 않은 데이터가 있다. 데이터를 공장에 보관하고 싶을 수도 있고, 때로는 자국 내에 보관해야 할 수도 있다." -- 빌 피어슨, 인텔 네트워크 및 엣지 그룹 부사장.

실제로 기업들의 생성형 AI 움직임이 엣지의 성장을 촉진하고 있다. 클라우드를 능가할 정도로 빠르게 성장하는 컴퓨팅 분야로 지목될 정도다. 리서치 기업 가트너에 따르면 2025년이면 기업에서 관리하는 데이터의 50% 이상이 데이터센터나 클라우드 외부에서 생성되고 처리될 것으로 예상된다.


인텔의 클라이언트 컴퓨팅 총괄 매니저인 미셸 존슨 홀트하우스가 엔드포인트 디바이스용 AI 가속 기능을 갖춘 코어 울트라 모바일 프로세서를 들고 있다. 

인텔, AMD, 엔비디아를 비롯한 마이크로프로세서 제조업체들은 이미 엣지 디바이스 CPU와 GPU가 생성형 AI 작업을 실행할 수 있도록 지원하는 전용 SoC 칩과 NPU를 생산하는 데 초점을 맞추고 있다.

아이폰 및 다른 스마트폰에 곧 적용될까?
IDC의 전 세계 연구 그룹 부사장인 릭 빌라스는 "아이폰 15가 아니라 아이폰 16 내부에 이 기능이 탑재될 것”이라고 기대하며, 애플 GPT라는 생성형 AI를 언급했다. 여러 보도에 따르면, 애플은 6월에 열리는 애플의 세계 개발자 회의에서 iOS 18과 생성형 AI 기능을 탑재한 새로운 시리를 공개하면서 애플 GPT를 발표할 것으로 관측된다.

그에 따르면 신형 아이폰 및 다른 제조업체의 스마트폰에는 구글의 픽셀 8의 '베스트 테이크' 사진 기능(사용자가 사람의 얼굴 사진을 이전 이미지의 다른 사진으로 교체할 수 있는 기능)과 같은 생성형 AI 기능을 처리하는 NPU가 탑재될 것으로 예상된다.

발라스는 "픽셀 폰이나 아마존 폰, 애플 폰에 탑재된 프로세서가 5장의 다른 사진을 활용해 재조정하여 완벽한 사진을 만들 수 있다. 사진 속 인물 누군가만 웃지 않는 사진이 사라지는 셈이다. 이는 소비자에게 매우 좋은 기능이다"라고 말했다.

그에 따르면, 이러한 방향으로의 진전은 사고의 전환을 이끌어낼 수 있다. 공급자가 모든 작업 비용을 담당해야 하는 결핍의 경제(an economy of scarcity)에서, 공급자가 일부 주요 작업을 엣지 디바이스에서 무료로 처리할 수 있다고 가정할 수 있는 풍요의 경제(an economy of abundance)를 향한 전환이다.

이 밖에 이른바 윈도우 12의 연말 출시도 엣지에서 생성형 AI를 채택하는 데 촉매제가 될 것으로 예상된다. 이 새로운 OS에 AI 기능이 내장될 것이 유력시되고 있다.

엣지 기기에 내장된 생성형 AI의 가능성은 데스크톱 상의 활용 및 사진을 조작하는 수준을 훨씬 뛰어넘는다. 인텔과 다른 칩 제조업체들은 제조, 소매, 의료 산업과 같은 업종을 대상으로 엣지 기반 생성형 AI 가속화를 추진하고 있다.

예를 들어 소매업체는 POS 시스템과 디지털 사이니지에 가속기 칩과 소프트웨어를 탑재할 수 있다. 제조업체는 공정 추적 및 결함 감지를 위해 로봇 공학 및 물류 시스템에서 AI 지원 프로세서를 활용할 수 있다. 그리고 의사는 진단용 AI 기반 측정, 생성형 AI 지원 워크플로우 등을 이용할 수 있다.

인텔은 12월에 출시한 코어 울트라 프로세서가 타사의 외장형 GPU와 결합된 이전 인텔 코어 프로세서와 비교해서 실시간 초음파 이미징 앱의 AI 성능 측면에서 22~25% 우수하다고 주장했다. 

AMD도 비슷한 주장을 펼친다. 회사의 글로벌 AI 마케팅 책임자 브라이언 매든은 “AI 지원 애플리케이션이 점점 더 엣지에 배포되고 있다. AI 지원 PC 또는 노트북부터 산업용 센서, 레스토랑의 소형 서버, 네트워크 게이트웨이, 심지어 5G 워크로드를 위한 클라우드 네이티브 엣지 서버에 이르기까지 다양한 사례가 가능하다”라고 말했다. 매든은 생성형 AI에 대해 "지난 50년 동안 가장 혁신적인 단일 기술”이라고 덧붙였다. 

실제로, 생성형 AI는 이미 과학, 연구, 산업, 보안 및 의료를 포함한 여러 산업에서 사용되고 있으며, 신약 발견 및 테스트, 의학 연구 및 의료 진단 및 치료 영역의 발전을 주도하고 있다. 예를 들어, AMD 적응형 컴퓨팅 고객인 클라리우스(Clarius)는 의사의 신체적 부상 진단 작업에 생성형 AI를 적용하고 있다. 또 일본의 히로시마 대학은 특정 유형의 암 진단을 돕기 위해 AMD 기반 AI를 사용하고 있다는 설명이다. 매든은 "심지어 AMD 내에서 자체 제품 및 서비스를 설계하는 데에도 활용하고 있다"라고 말했다.

반도체 부족의 시대
현재 실리콘 업계는 프로세서 부족이라는 문제를 안고 있다. 바이든 행정부가 실리콘 생산을 늘리기 위해 칩스(CHIPS) 법안을 추진한 이유 중 하나다. 그 외에 생성형 AI 작업과 관련해서는 전력 소비 문제가 있다.

빌라스는 "전력을 무시무시하게 소비한다. 표준 기업 데이터센터는 랙당 약 12kw의 랙을 수용할 수 있다. 그러나 대규모 언어 모델링을 수행하는 데 필요한 GPU 랙 중 하나는 약 80kw를 소비하는 현실이다. 따라서 어떤 의미에서 현대 기업 데이터센터의 90%는 비용 문제로 인해 데이터센터에 AI를 도입할 수 없는 상황이다"라고 말했다.

특히 인텔이 데이터센터의 AI를 엣지 디바이스로 전환하는 움직임에서 혜택을 볼 수 있는 기업이다. 인텔이 클라우드, 기업 데이터센터, 그리고 엣지에서의 AI 가속화를 의미하는 ‘AI 에브리웨어’라는 테마를 제시하는 배경이다.

AI 애플리케이션과 LLM 기반 플랫폼은 추론 알고리즘, 즉 데이터 세트에 머신러닝을 적용하여 결과를 생성하는 알고리즘을 실행한다. 이러한 출력은 기본적으로 이전에 나온 내용을 기반으로 소프트웨어의 문장, 이미지 또는 코드 줄에서 다음 단어를 예측해 이뤄진다.

데이터센터의 GPU 랙은 인터넷 구석구석의 정보와 기업이 제공하는 독점 데이터 세트를 제공하는 LLM의 학습을 처리하는 반면, NPU는 덜 집약적인 추론 처리를 처리할 수 있을 전망이다. 스마트폰이나 PC에는 기기나 클라우드에 있는 데이터에 대한 추론 기능을 수행하는 하드웨어와 소프트웨어만 있으면 된다.

새로운 인텔 4코어 공정을 사용하여 최초로 제작된 인텔의 코어 울트라 프로세서는 PC에서 AI 가속을 지원하는 데 큰 역할을 했다. 하지만 인텔의 네트워크 및 엣지 그룹 부사장인 빌 피어슨에 따르면 이제 PC를 넘어 엣지 디바이스로 향하고 있다.

그는 "CPU, GPU, NPU가 모두 탑재된다. 이들 모두 AI를 실행할 수 있는 기능성을 제공하며, 특히 추론과 가속화는 엣지에 적합한 사용 사례다. 아울러 이러한 작업을 수행함에 있어 '클라우드로 전송하고 싶지 않은 데이터가 있을 수 있다. 비용 때문일 수도 있고, 비공개 데이터이기 때문일 수도 있다. 때로는 특정 지역이나 국가 내에 데이터를 보관하고 싶기 때문일 수도 있다. 데이터가 있는 곳에서 처리하도록 함으로써 우리는 제품 내에서 AI를 활용할 수 있도록 지원할 수 있다"라고 말했다.

인텔은 1억 개 이상의 PC용 프로세서를 몇 년 내에 출하할 예정이라며 이로써 전체 PC의 80%에서 AI를 구동할 것으로 예상했다. 그리고 마이크로소프트는 윈도우 다양한 AI 기반 기능을 추가하기로 약속한 상태다. 애플도 비슷한 계획을 가지고 있다. 이미 2017년에 아이폰에서 AI 작업을 수행하기 위해 맞춤 제작된 칩의 일부인 최초의 뉴럴 엔진이 탑재된 A11 바이오닉 SoC를 출시한 바 있다. 그 이후 등장한 모든 A 시리즈 칩에는 뉴럴 엔진이 포함되었으며, 2020년에 출시된 M1 프로세서는 맥에 AI 처리 기능을 도입했다. M1에 이어 M2가 출시됐고, 작년에는 업계 최초의 개인용 컴퓨터용 3나노미터 칩인 M3, M3 Pro, M3 맥스가 등장했다.

새로운 세대의 애플 실리콘은 더 빠르고 효율적인 CPU와 더 강력한 뉴럴 엔진을 내장해 아이폰, 아이패드, 맥에서 더 복잡한 AI 작업을 처리할 수 있다.

골드 애널리스트는 "새로운 상호 작용 방식과 고급 기능 측면에서 변곡점에 이르렀다. 많은 새로운 회사가 등장하고 있다. CPU 단독에서 통합 GPU 온칩으로 발전한 것처럼, 앞으로 거의 모든 프로세서에 NPU AI 가속기가 내장될 것이다. 이는 소프트웨어의 여러 측면을 변화시킬 고급 기능에 대한 새로운 전장이자 원동력이 될 것"이라고 말했다.


2023년에 출시된 애플의 최신 AI 지원 M3 칩은 더 빠른 뉴럴 엔진과 함께 제공된다. 기기는 더 복잡한 AI 작업을 처리할 수 있다.

골드에 따르면 AMD 또한 프로세서 제품군에도 AI 가속 기능을 추가하고 있으며, 일부 영역에서 인텔의 리더십에 도전할 것으로 전망된다. 

그는 "2~3년 안에 AI가 없는 PC를 사용하는 것은 큰 단점이 될 것이다. 인텔이 이를 주도하고 있다. 향후 3년 내에 최소 65%에서 75%에 달하는 PC와 거의 모든 중급 및 프리미엄 스마트폰에 AI 가속 기능이 내장될 것으로 예상한다”라고 말했다.

딜로이트의 새 보고서에 따르면 메모리 가격 약세와 스마트폰 및 컴퓨터 칩 수요 감소라는 문제에 직면한 반도체 업계에게 생성형 AI 칩은 새 성장 영역을 의미한다. 이 보고서는 "2024년 AI 칩 시장은 강세를 보일 것으로 보인다. 2024년에 판매될 칩 매출의 8.5%에 해당하는 500억 달러 이상이 이 영역에서 비롯될 것"이라고 밝혔다. 딜로이트는 2027년까지 AI 칩(주로 genAI 칩)의 매출이 4,000억 달러에 달할 것이라는 전망을 내놓기도 했었다. 

AI 칩 시장 점유율을 차지하기 위한 경쟁은 향후 몇 년 동안 더욱 치열해질 전망이다. 출처에 따라 수치는 다르지만, 주식 시장 분석 업체인 스톡리틱스는 AI 칩 시장이 2022년에 약 450억 달러, 2023년에 540억 달러에 달할 것으로 추정하고 있다. 

스톡리틱스의 에디스 리드 애널리스트는 "인텔이 새로운 AI 칩인 가우디3를 공개할 계획인 가운데 AI 칩은 기술 업계의 새로운 화두이다. 이로 인해 내년에 엔비디아와 AMD가 경쟁에 어려움을 겪을 수 있다. 엔비디아는 여전히 AI 칩 모델에서 지배적인 기업이다. 하지만 많은 신생 기업이 AI 칩 제조 경쟁에 관심을 보이고 있다는 점을 고려하면 엔비디아의 폭발적인 시장 지위는 바뀔 수 있다"라고 말했다.

리드에 따르면 오픈AI의 챗GPT가 엔비디아 GPU를 사용하는데, 이것이 엔비디아의 시장 점유율 1위를 돕는 요인 중 하나다. 그는 "AI 분야에서 엔비디아의 핵심은 H급 프로세서다. 가장 많은 수익을 창출하고 가장 많은 수요가 있는 분야”라고 말했다.

지연 시간, 대역폭, 보안 문제를 완화하는 AI 엣지 컴퓨팅
엣지에 동작하는 AI는 처리 작업이 데이터와 가까운 곳에서 이루어지므로 클라우드 제공업체를 통할 때보다 훨씬 빠르고 안전할 수 있다. AMD의 매든은 "실제로 엔드포인트에서 엣지, 클라우드에 이르기까지 AI가 배포되고 있다. 기업들은 혜택을 누릴 수 있는 모든 공간에 AI를 사용할 것이다. 우리는 이미 AI PC의 등장으로 이를 목격하고 있다"라고 말했다.

그러면서도 매든은 기업 사용자들이 클라우드 서비스나 온프레미스 AI 인스턴스도 활용할 것이라고 전망했다. 그는 "이는 하이브리드 접근 방식으로, 유동적이고 유연하다. 이러한 장점은 엣지에서도 유효하다. 사용자는 초저지연, 향상된 대역폭, 컴퓨팅 위치를 활용하여 AI 애플리케이션 또는 인스턴스의 생산성을 극대화할 수 있다. 의료와 같은 분야에서는 AI를 통해 더 나은 결과를 도출하는 데 중요한 역할을 하게 될 것이다"라고 말했다.

리테일 매장의 스마트 앱용 컴퓨터 비전 처리나 자동차 물체 감지 기능 등 시기적절한 의사결정을 위해 엣지에서의 생성형 AI가 필요한 다른 분야도 있다.  그리고 로컬에서 데이터를 처리할 수 있다는 것은 보안 및 프라이버시가 우려되는 애플리케이션에 도움이 될 수 있다.

AMD는 모바일용 라이젠 8040 시리즈 칩과 전용 AI 가속기인 라이젠 AI NPU가 탑재된 데스크탑용 라이젠 8000G 시리즈를 통해 시장을 공략할 방침이다 그리고 올해 말에는 2세대 가속기를 출시할 계획이다.

이 밖에 AMD의 적응형 SoC인 버설(Versal) 시리즈는 사용자가 여러 AI 워크로드를 동시에 실행할 수 있도록 지원한다. 버설 AI 엣지(Versal AI Edge) 시리즈는 자율 주행, 공장 자동화, 고급 의료 시스템 및 항공우주 시스템의 다중 임무 페이로드와 같은 고성능, 저지연 용도에 사용될 수 있다. 회사는 자동차용 버설 AI 엣지 XA 적응형 SoC와 라이젠 임베디드 V2000A 시리즈 프로세서, 그리고 내년에는 우주여행을 위한 버설 AI 엣지 및 버설 AI 코어 시리즈 적응형 SoC를 출시할 계획이다.

칩에만 국한되지 않는다
엔비디아의 임베디드 및 엣지 컴퓨팅 담당 부사장인 디푸 탈라는 다음과 같이 말했다. 

“생성형 A가 거의 모든 산업에 자연어 처리와 LLM의 힘을 전달하고 있다. 여기에는 결함 감지, 실시간 자산 추적, 자율 계획 및 탐색, 인간과 로봇의 상호 작용을 위한 로봇 및 물류 시스템이 포함된다. 창고, 공장, 공항, 가정, 건물, 교통 교차로 등 스마트 공간과 인프라 전반에 걸쳐 사용되고 있다.”

탈라는 이어 "생성형 AI가 발전하고 애플리케이션 요구사항이 점점 더 복잡해짐에 따라 엣지 배포를 간소화하고 가속화하는 플랫폼으로의 근본적인 전환이 필요하다"라고 말했다.

이러한 니즈에 부응하기 위해 AI 칩 개발 기업들은 개발자가 이러한 작업을 위한 자체 애플리케이션을 더 쉽게 만들 수 있도록 더 복잡한 머신 러닝 작업을 처리할 수 있는 특수 소프트웨어를 도입하고 있다.

엔비디아는 엣지 개발자가 ‘원거리 엣지’에 있는 디바이스에서 AI 모델을 훈련할 수 있도록 돕는 로우코드 TAO 툴킷을 설계했다. ARM은 TAO를 활용하여 에토스 NPU(Ethos NPU) 디바이스에서의 AI 런타임을 최적화하고 있으며, ST마이크로일렉트로닉스는 STM32 마이크로컨트롤러에서 복잡한 비전 AI를 실행하는 데 TAO를 활용하고 있다.

탈라는 "생산 현장용 엣지 AI 솔루션을 개발하려면 특정 사용 사례에 맞는 AI 모델 개발 및 학습 최적화, 플랫폼에 강력한 보안 기능 구현, 애플리케이션 오케스트레이션, 플릿 관리, 원활한 엣지-클라우드 간 통신 구축 등의 작업이 필요하다”라고 말했다.

인텔은 오픈비노(OpenVINO)라는 오픈소스 툴 키트를 만들었다. 원래 컴퓨터 비전 시스템에 내장되어 있었던 이 툴은 처음부터 주로 엣지에서 사용되고 있었다. 이후 인텔은 텍스트와 비디오를 포함하는 멀티모달 시스템을 운영하기 위해 오픈비노를 확장했으며, 이제는 생성형 AI 영역까지 확장했다.

인텔의 피어슨은 "이 프로젝트의 핵심은 고객들이 다양한 유형의 AI 가속기에 맞게 프로그래밍하는 방법을 찾고자 하는 것이었다. 오픈비노는 하위의 컴퓨팅 유형을 묶어놓은 API 기반 프로그래밍 메커니즘이다. 이는 적절한 하드웨어 유형에서 잘 실행될 것이다.  예를 들어 코어 울트라에 이 기능을 추가하면 OpenVINO는 NPU와 GPU, CPU를 활용할 수 있게 된다”라고 설명했다.

그는 이어 "따라서 이 툴킷은 개발자의 삶을 크게 간소화할 뿐만 아니라 개발자가 구축하는 애플리케이션에 우수한 성능을 제공한다"라고 덧붙였다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.