Offcanvas

How To / 디지털 디바이스 / 소비자IT

'인텔 GPU의 핵심' Xe HPG 아키텍처 살펴보기

2022.04.05 Brad Chacos   |  PCWorld
새로운 경쟁이 시작됐다. 지난주 인텔이 아크(Arc) GPU를 발표하면서 오랫동안 예고했던 일반 사용자용 외장 그래픽 카드 시장 진입을 선포한 것이다. ‘칩질라(Chipzilla)’라고 불리는 거물 인텔이 새로운 Xe HPG(High-performance gaming) GPU 아키텍처로 본격 경쟁에 뛰어든 지금 엔비디아와 AMD가 긴장할 만도 하다.

인텔은 아크를 발표하면서 이례적인 (하지만 전략적으로 스마트한) 접근방식을 취하며 저렴한 가격의 휴대용 노트북을 위한 아크 3 그래픽 카드를 출시했다. 엔비디아와 AMD가 확고한 위치를 점한 데스크톱 게임 프레임률을 두고 치고 받는 것보다 노트북과 소프트웨어 지원에서 상당한 강점을 우선 지원하는 것이다. 아크 3 노트북의 GPU 공개와 인텔의 뛰어난 기능에 대해서는 앞선 기사에서 다뤘는데, 새로운 노트북 PC에 대한 일반적인 이해를 돕는 기사다. 인텔 아크 GPU와 인텔 코어 프로세서를 함께 사용할 때 놀라운 효과를 가져오는 딥 링크를 비롯하여 매력적인 요소가 상당히 많다.

하지만 이 기사의 요점은 다르다. 신제품 발표와 함께 인텔 펠로우 톰 피터슨은 아크 ‘연금술사’ 그래픽 카드의 기반이 되는 Xe HPG 아키텍처의 전반적인 개요를 제공했다. 인텔 그래픽 카드에 힘을 실어주는 실제 혁신 기술을 상세히 살펴본다.  

이 기사에서는 엔비디아 암페어, AMD의 RDNA 2 아키텍처에서처럼 인텔 아크의 Xe HPG 칩 내부를 기술적으로 간단히 설명할 것이다. 엔비디아와 AMD가 설계에 독자적인 기술과 용어를 사용하는 것과 매우 유사하게 인텔의 아크 칩은 (설명이 필요한 클럭 속도의 새로운 관점을 포함한) 약간의 자체적인 개념에 의존한다. 그래서 아크를 경쟁 GPU 아키텍처와 직접 비교하기는 쉽지 않다. 인텔은 ROP나 TMU 등의 일반적인 용어조차 사용하지 않는다. 다만, 이 작업을 마치면, Xe HPG의 동력을 확실히 이해하게 될 것이다. 자, 시작해보자.
 

Xe HPG와의 첫 인사

ⓒ Intel

인텔의 경우 Xe HPG ‘렌더 슬라이스’는 모든 아크 GPU의 중추다. 인텔 노트북 및 데스크톱 아크 제품은 다양한 시장 요구에 따라 성능을 조절할 수 있지만, 그 중심에는 렌더 슬라이스가 있고 여기에는 레이 트레이스 유닛, 래스터라이저, 기하학 블록 및 아크용 기본 구성 블록, Xe코어 그 자체가 모두 포함된다. 노트북 형태의 아크 A770M GPU로 대표되는 Xe XPG는 아크 모바일 GPU에서 최대 8개까지 렌더 슬라이스를 확장할 수 있다.

각 렌더 슬라이스에는 4개의 Xe 코어 및 4개의 레이 트레이스 유닛과 최신 GPU 실행에 필요한 기타 모든 비트가 포함되어 있다. 이러한 렌더 슬라이스는 다이렉트X 12 얼티밋을 완전 지원하며, 이는 인텔 아크 GPU가 레이 트레이스, VRS(Variable Rate Shading), 메쉬 쉐이딩(Mesh Shading) 및 표준과 관련된 기타 모든 기능을 처리할 수 있다는 것을 의미한다. 
 
ⓒ Intel

Xe 코어 자체를 더 자세히 살펴보자. 각 Xe 코어(다시 말하지만 렌더 슬라이스당 4개가 있음)는 3개의 키 비트로 구성된다. 즉, 더욱 전통적인 래스터화 작업을 처리하는 16개의 256비트 ‘XVE’ 벡터 엔진, 머신러닝 작업을 처리하는 16개의 1024비트 ‘XMX’ 매트릭스 엔진(엔비디아의 경쟁 RTX GPU의 텐서 코어 등), 192KB의 공유 LSL/1 캐시다. 이 캐시는 컴퓨팅 워크로드 중 작업, 또는 게임 중 쉐이더 및 텍스처 유지에 사용된다.
 
ⓒ Intel


PC 게임 분야의 대기업은 레이 트레이싱이 그래픽의 미래라며 기대를 걸고 있지만, 현재로서는 기존 렌더링 방식이 여전히 지배적이다. 각 Xe 벡터 엔진에는 기존의 쉐이딩 작업을 처리하는 전용 부동소수점(FP) 실행 포트와 정수 기반 작업을 동시에 수행할 수 있는 공유 INT/EM 포트가 있다.

엔비디아는 정수 작업이 FP32 파이프라인을 막는 것을 방지하기 위해 RTX 20 시리즈 튜링 아키텍처와 함께 동시 FP/INT 파이프라인을 도입했다. 그 이후로 FP/INT 파이프라인은 표준이 되었고 PCWorld는 2018년 기사에서 “엔비디아가 실제 게임의 작동 방식을 조사했을 때 100개의 부동소수점 명령이 실행될 때마다 평균 36개에서 많게는 50개의 부동소수점 명령도 처리되어 작업이 방해되는 것을 발견했다. 새로운 정수 파이프라인은 이러한 추가 명령을 FP32 파이프라인과 분리하여 동시에 처리한다. 두 작업을 동시에 실행하면 속도가 크게 향상된다”라고 설명했다.

Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.