2019.04.04

인공지능·IoT 시대의 '슈퍼 루키'··· 인텔, FPGA 신제품 '애질렉스' 공개

Marc Ferranti | Network World
인텔이 1년 반 가까이 테스트를 마치고 마침내 애질렉스(Agilex) FPGA 제품군을 공개했다. 코드명 팔콘 메사(Falcon Mesa)로 알려진 이 제품은 점점 늘어나는 AI와 금융, 데이터베이스, IoT 관련 데이터 작업 부하를 데이터센터와 네트워크에서 더 유연하게 처리할 수 있도록 지원한다. 애질렉스를 탑재한 첫 제품은 3/4분기에 나올 것으로 보인다. 



애질렉스는 최신 FPGA 제품이다. FPGA(Field Programmable Gate Array)는 제조 후 특정 작업에 최적화한 알고리즘으로 프로그래밍할 수 있고 심지어 장치에 탑재한 후에도 재프로그래밍이 가능한 것이 특징이다. 프로그램형 인터커넥트를 통해 연결된 CLB(Configurable Logic Block) 매트릭스를 중심으로 구축된다. 이런 특성 덕분에 일반 CPU보다 와트당 성능이 더 효율적이고 심지어 더 높은 성능을 보이기도 한다. 데이터센터가 엄청난 양의 데이터를 처리하게 되면서 FPGA는 컴퓨팅 부문에서 점차 중심적인 위치로 부상하고 있다.

가속 컴퓨팅의 급부상
CPU에 FPGA를 패키지화해 특정 작업을 오프로딩하면 전반적인 데이터센터 및 네트워크 효율성을 높일 수 있다. 가속 컴퓨팅이라고도 알려진 이 개념은 데이터센터와 네트워크 관리자가, 폭증하는 데이터와 네트워크 트래픽을 처리할 수 있는 비용 효율적인 수단으로 주목받고 있다. 인텔의 PSG(Programmable Solutions Group) 책임자 댄 맥나마라는 "이 데이터 때문에 엣지부터 네트워크와 클라우드에 이르기까지 혁신 경쟁이 촉발됐다. 그 결과 역사상 가장 큰 규모로 FPGA가 확산하고 있다"라고 말했다.

애질렉스는 인텔이 2015년 알테라를 167억 달러에 인수한 이후 처음 내놓은 FPGA 제품이기도 하다. 이전 세대와 비교해 수십억 개의 트랜지스터를 FPGA에 집적한 인텔의 10mm 제조 공정으로 생산된다. 인텔은 애질렉스에 하이퍼플렉스를 적용해 기존 최신 FPGA 제품군인 스트라틱스10보다 40% 높은 성능을 발휘한다고 설명했다. 하이퍼플렉스 아키텍처에는 대역폭뿐만 아니라 면적과 전력 효율성을 개선하기 위해 코어 패브릭 전반에 걸쳐 데이터를 임시로 저장하는 추가 레지스터 '하이퍼-레지스터'를 포함한 것이 특징이다.

메모리 간섭성이 관건
애질렉스 FPGA는 인텔의 2세대 제온 스케일러블 프로세스 같은 CPU와 FPGA 및 GPU 등의 특수 용도 가속기의 메모리 간섭성을 유지하기 위해 고안된 고속 인터커넥트 CXL(Compute Express Link)을 지원하는 첫 프로세스이기도 하다. 이를 통해 여러 프로세서가 같은 메모리 공간에 쓰려고 시도할 때 충돌하지 않도록 하고 CPU와 가속기가 메모리를 공유할 수 있도록 지원한다.

무어 인사이트 앤 스트래티지의 설립자 겸 수석 애널리스트 패트릭 무어헤드는 "이 CXL 버스를 이용하면 모든 메모리를 사용하는 애플리케이션을 실제로 작성할 수 있다. 즉, 대형 메모리 작업 부하에서 프로그래밍 모델을 간소할 수 있다"라고 말했다. 현재 인텔의 가속 컴퓨팅 전략의 핵심은 FPGA, 기타 가속기, CPU 통합 등이다. 인텔은 이를 'A2A(Any to Any)' 통합이라 부른다.

'A2A' 통합은 데이터센터에 필수적
애질렉스 제품군은 EMIB(Embedded Multi-die Interconnect Bridge) 패키징 기술을 통해 재프로그래밍이 불가능한 특수 기능 프로세서인 제온 스케일러블 CPU 또는 ASIC까지 FPGA 패브릭과 함께 통합할 수 있다. 이 기술을 확보하기 위해 인텔은 지난 해 FPGA와 ASIC 사이의 중간 기술인 '구조화된 ASIC' 제조업체 eASIC을 인수했다. 이를 통해 데이터 집약적 작업 부하를 처리할 때 최적의 비용과 성능 효율성 제공한다는 구상이었다.

지난 2일 인텔은 샌프란시스코에서 열린 자사의 DCID(Data Centric Innovation Day) 행사에서 애질렉스를 공개하면서 데이터센터용 프로세서 통합의 중요성을 강조했다. 또한 2세대 제온 스케일러블 제품군에 대한 계획도 발표했다.

전통적으로 FPGA는 주로 임베디드 기기, 통신 장비, 초대형 데이터센터에서 사용됐다. 기업에 직접 판매되는 제품은 아니었다. 델 EMC와 후지쓰의 주문제작 서버 등이 인텔 스트라틱스 10 및 아리아10 FPGA를 사용한 여러 제품을 만들어 기업에 판매하고 있다. 이들이 주류로 자리잡기 위해서는 FPGA 프로그래밍을 간소화하는 것이 핵심이라는 지적이다. 맥나마라는 "소프트웨어가 정말 중요하다. 더 많은 사용자를 확보하고 FPGA를 프로그래밍하기가 더 쉬워져야 한다"라고 말했다.

인텔은 애질렉스 하드웨어 개발자에게 인텔의 쿼터스 프라임 디자인 툴을 제공할 예정이다. 그러나 FPGA 소프트웨어 개발의 진정한 혁신은 지난해 12월에 발표한 인텔의 원API 개념이다. 무어헤드는 "원API의 핵심 개념은 프로그래머가 작업을 설정하면 원API가 이를 실행할 최적의 칩을 자체적으로 결정하는 것이다. 이 정도면 '마법의 API'라고 부를 수 있을 정도다. 인텔이 알테라를 인수한 이후 예상된 일이기도 하지만, 일단 SAP와 오라클 등 대형 개발업체가 먼저 도입하고 이후 소형 ISV와 사용자 정의 기업 애플리케이션으로 확산할 것으로 보인다"라고 말했다.



인텔은 보급형부터 고급형, F, I, M 시리즈까지 서로 다른 3가지 애질렉스 제품군을 내놓을 계획이다. 시리즈에 따라 PCIe(Peripheral Component Interconnect express) 5세대, DDR5 RAM을 포함한 다양한 메모리 유형, HBM(High-Bandwidth Memory), 옵테인 DC 영구 메모리를 지원한다. bfloat16 숫자 형식을 포함해 최대 112Gbps의 트랜시버 데이터 속도와 AI를 위한 더 높은 연산 정밀도를 제공한다.

FPGA는 AI, 유전공학, 금융 및 데이터베이스 애플리케이션 등의 서버 기반 작업 부하를 빠르게 처리하는 것 외에 네트워킹에서도 중요한 역할을 한다. 와트당 비용 효율성이 높아 엣지 네트워크, IoT 기기, DPI(Deep Packet Inspection) 등에 적합하다. 또한 5G 표준 변화에 따라 재프로그래밍이 가능해 5G 기지국에서도 사용할 수 있다. 5G 표준이 확정되면 더 높은 비용 효율성을 위해 특수 목적 ASIC로 오프로딩하는 것도 가능할 것으로 보인다.

애질렉스의 경쟁자는 자일링스의 ACAP
애질렉스의 강력한 경쟁자는 올 후반기에 출시될 예정인 자일링스의 버설(Versal) 제품군이다. 자일링스는 FPGA 시장에서 수 년 동안 알테라와 경쟁했고, 버설을 통해 ACAP(Adaptive Compute Acceleration Platform)라는 새로운 디자인 카테고리를 선보였다. 버설 ACAP는 TSMC의 7nm 제조 공정 기술을 통해 제조된다. 인텔이 높은 트랜지스터 밀도를 달성했더라도 애질렉스와 버설 칩이 제공하는 트랜지스터의 수는 비슷할 가능성이 높다고 무어헤드는 전망했다.

애질렉스와 버설은 일부 세부사항에서 차이가 있지만 기본적으로는 유사하다. 프로그래밍 가능한 프로세서는 이전 세대의 FPGA보다 더 광범위한 프로그래밍 옵션을 제공하며 CPU와 함께 작동해 데이터 집약적 작업 부하를 빠르게 처리하고 메모리 일관성을 제공한다. 반면 버설 제품군은 CXL 대신 CCIX(Cache Coherent Interconnect for Accelerators) 인터커넥트 패브릭을 사용한다.

인텔과 자일링스 모두 기업용 애질렉 또는 버설 제품을 위한 OEM 지원을 아직 발표하지 않았다. 그러나 이 역시 올해 바뀔 것으로 전망된다. ciokr@idg.co.kr



2019.04.04

인공지능·IoT 시대의 '슈퍼 루키'··· 인텔, FPGA 신제품 '애질렉스' 공개

Marc Ferranti | Network World
인텔이 1년 반 가까이 테스트를 마치고 마침내 애질렉스(Agilex) FPGA 제품군을 공개했다. 코드명 팔콘 메사(Falcon Mesa)로 알려진 이 제품은 점점 늘어나는 AI와 금융, 데이터베이스, IoT 관련 데이터 작업 부하를 데이터센터와 네트워크에서 더 유연하게 처리할 수 있도록 지원한다. 애질렉스를 탑재한 첫 제품은 3/4분기에 나올 것으로 보인다. 



애질렉스는 최신 FPGA 제품이다. FPGA(Field Programmable Gate Array)는 제조 후 특정 작업에 최적화한 알고리즘으로 프로그래밍할 수 있고 심지어 장치에 탑재한 후에도 재프로그래밍이 가능한 것이 특징이다. 프로그램형 인터커넥트를 통해 연결된 CLB(Configurable Logic Block) 매트릭스를 중심으로 구축된다. 이런 특성 덕분에 일반 CPU보다 와트당 성능이 더 효율적이고 심지어 더 높은 성능을 보이기도 한다. 데이터센터가 엄청난 양의 데이터를 처리하게 되면서 FPGA는 컴퓨팅 부문에서 점차 중심적인 위치로 부상하고 있다.

가속 컴퓨팅의 급부상
CPU에 FPGA를 패키지화해 특정 작업을 오프로딩하면 전반적인 데이터센터 및 네트워크 효율성을 높일 수 있다. 가속 컴퓨팅이라고도 알려진 이 개념은 데이터센터와 네트워크 관리자가, 폭증하는 데이터와 네트워크 트래픽을 처리할 수 있는 비용 효율적인 수단으로 주목받고 있다. 인텔의 PSG(Programmable Solutions Group) 책임자 댄 맥나마라는 "이 데이터 때문에 엣지부터 네트워크와 클라우드에 이르기까지 혁신 경쟁이 촉발됐다. 그 결과 역사상 가장 큰 규모로 FPGA가 확산하고 있다"라고 말했다.

애질렉스는 인텔이 2015년 알테라를 167억 달러에 인수한 이후 처음 내놓은 FPGA 제품이기도 하다. 이전 세대와 비교해 수십억 개의 트랜지스터를 FPGA에 집적한 인텔의 10mm 제조 공정으로 생산된다. 인텔은 애질렉스에 하이퍼플렉스를 적용해 기존 최신 FPGA 제품군인 스트라틱스10보다 40% 높은 성능을 발휘한다고 설명했다. 하이퍼플렉스 아키텍처에는 대역폭뿐만 아니라 면적과 전력 효율성을 개선하기 위해 코어 패브릭 전반에 걸쳐 데이터를 임시로 저장하는 추가 레지스터 '하이퍼-레지스터'를 포함한 것이 특징이다.

메모리 간섭성이 관건
애질렉스 FPGA는 인텔의 2세대 제온 스케일러블 프로세스 같은 CPU와 FPGA 및 GPU 등의 특수 용도 가속기의 메모리 간섭성을 유지하기 위해 고안된 고속 인터커넥트 CXL(Compute Express Link)을 지원하는 첫 프로세스이기도 하다. 이를 통해 여러 프로세서가 같은 메모리 공간에 쓰려고 시도할 때 충돌하지 않도록 하고 CPU와 가속기가 메모리를 공유할 수 있도록 지원한다.

무어 인사이트 앤 스트래티지의 설립자 겸 수석 애널리스트 패트릭 무어헤드는 "이 CXL 버스를 이용하면 모든 메모리를 사용하는 애플리케이션을 실제로 작성할 수 있다. 즉, 대형 메모리 작업 부하에서 프로그래밍 모델을 간소할 수 있다"라고 말했다. 현재 인텔의 가속 컴퓨팅 전략의 핵심은 FPGA, 기타 가속기, CPU 통합 등이다. 인텔은 이를 'A2A(Any to Any)' 통합이라 부른다.

'A2A' 통합은 데이터센터에 필수적
애질렉스 제품군은 EMIB(Embedded Multi-die Interconnect Bridge) 패키징 기술을 통해 재프로그래밍이 불가능한 특수 기능 프로세서인 제온 스케일러블 CPU 또는 ASIC까지 FPGA 패브릭과 함께 통합할 수 있다. 이 기술을 확보하기 위해 인텔은 지난 해 FPGA와 ASIC 사이의 중간 기술인 '구조화된 ASIC' 제조업체 eASIC을 인수했다. 이를 통해 데이터 집약적 작업 부하를 처리할 때 최적의 비용과 성능 효율성 제공한다는 구상이었다.

지난 2일 인텔은 샌프란시스코에서 열린 자사의 DCID(Data Centric Innovation Day) 행사에서 애질렉스를 공개하면서 데이터센터용 프로세서 통합의 중요성을 강조했다. 또한 2세대 제온 스케일러블 제품군에 대한 계획도 발표했다.

전통적으로 FPGA는 주로 임베디드 기기, 통신 장비, 초대형 데이터센터에서 사용됐다. 기업에 직접 판매되는 제품은 아니었다. 델 EMC와 후지쓰의 주문제작 서버 등이 인텔 스트라틱스 10 및 아리아10 FPGA를 사용한 여러 제품을 만들어 기업에 판매하고 있다. 이들이 주류로 자리잡기 위해서는 FPGA 프로그래밍을 간소화하는 것이 핵심이라는 지적이다. 맥나마라는 "소프트웨어가 정말 중요하다. 더 많은 사용자를 확보하고 FPGA를 프로그래밍하기가 더 쉬워져야 한다"라고 말했다.

인텔은 애질렉스 하드웨어 개발자에게 인텔의 쿼터스 프라임 디자인 툴을 제공할 예정이다. 그러나 FPGA 소프트웨어 개발의 진정한 혁신은 지난해 12월에 발표한 인텔의 원API 개념이다. 무어헤드는 "원API의 핵심 개념은 프로그래머가 작업을 설정하면 원API가 이를 실행할 최적의 칩을 자체적으로 결정하는 것이다. 이 정도면 '마법의 API'라고 부를 수 있을 정도다. 인텔이 알테라를 인수한 이후 예상된 일이기도 하지만, 일단 SAP와 오라클 등 대형 개발업체가 먼저 도입하고 이후 소형 ISV와 사용자 정의 기업 애플리케이션으로 확산할 것으로 보인다"라고 말했다.



인텔은 보급형부터 고급형, F, I, M 시리즈까지 서로 다른 3가지 애질렉스 제품군을 내놓을 계획이다. 시리즈에 따라 PCIe(Peripheral Component Interconnect express) 5세대, DDR5 RAM을 포함한 다양한 메모리 유형, HBM(High-Bandwidth Memory), 옵테인 DC 영구 메모리를 지원한다. bfloat16 숫자 형식을 포함해 최대 112Gbps의 트랜시버 데이터 속도와 AI를 위한 더 높은 연산 정밀도를 제공한다.

FPGA는 AI, 유전공학, 금융 및 데이터베이스 애플리케이션 등의 서버 기반 작업 부하를 빠르게 처리하는 것 외에 네트워킹에서도 중요한 역할을 한다. 와트당 비용 효율성이 높아 엣지 네트워크, IoT 기기, DPI(Deep Packet Inspection) 등에 적합하다. 또한 5G 표준 변화에 따라 재프로그래밍이 가능해 5G 기지국에서도 사용할 수 있다. 5G 표준이 확정되면 더 높은 비용 효율성을 위해 특수 목적 ASIC로 오프로딩하는 것도 가능할 것으로 보인다.

애질렉스의 경쟁자는 자일링스의 ACAP
애질렉스의 강력한 경쟁자는 올 후반기에 출시될 예정인 자일링스의 버설(Versal) 제품군이다. 자일링스는 FPGA 시장에서 수 년 동안 알테라와 경쟁했고, 버설을 통해 ACAP(Adaptive Compute Acceleration Platform)라는 새로운 디자인 카테고리를 선보였다. 버설 ACAP는 TSMC의 7nm 제조 공정 기술을 통해 제조된다. 인텔이 높은 트랜지스터 밀도를 달성했더라도 애질렉스와 버설 칩이 제공하는 트랜지스터의 수는 비슷할 가능성이 높다고 무어헤드는 전망했다.

애질렉스와 버설은 일부 세부사항에서 차이가 있지만 기본적으로는 유사하다. 프로그래밍 가능한 프로세서는 이전 세대의 FPGA보다 더 광범위한 프로그래밍 옵션을 제공하며 CPU와 함께 작동해 데이터 집약적 작업 부하를 빠르게 처리하고 메모리 일관성을 제공한다. 반면 버설 제품군은 CXL 대신 CCIX(Cache Coherent Interconnect for Accelerators) 인터커넥트 패브릭을 사용한다.

인텔과 자일링스 모두 기업용 애질렉 또는 버설 제품을 위한 OEM 지원을 아직 발표하지 않았다. 그러나 이 역시 올해 바뀔 것으로 전망된다. ciokr@idg.co.kr

X