미국 MIT 대학교 링컨 연구소 슈퍼컴 센터(Lincoln Laboratory의 Supercomputing Center) TX-GAIA(Green AI Accelerator)라고 이름 붙인 슈퍼컴 구축을 완료했다고 발표했다.
TX-GAIA는 ‘Green AI Accelerator)라는 이름에서 짐작할 수 있듯이, 인공지능 연구에 특화된 기능을 갖춘 슈퍼컴퓨터다. 모델링이나 시뮬레이션 같은 기본적인 슈퍼컴의 기능은 물론, 복잡한 심층 신경망(DNN;Deep Neural Network)을 수행할 수 있는 고성능 컴퓨팅(HPC;High Performance Computing)과 인공지능에 최적화된 성능을 제공하도록 설계됐다.
TX-GAIA(Green AI Accelerator)가 구축된 MIT 대학교 LLSC의 모듈형 데이터센터인 에코팟(EcoPOD) 모듈형 데이터 센터. TX-GAIA는 100 AI 플롭스의 심층신경망 연산능력을 갖췄으며, 인텔 제온 스케일러블 프로세서와 엔비디아 32GB V100 GPU가 각각 896개 사용됐다.(사진 : MIT LLSC)
TX-GAIA 구축은 HPE(Hewlett Packard Enterprise)가 담당했다. HP는 ‘
HP Apollo 2000’ 시스템을 기반으로, 인텔 제온 스케일러블(Intel Xeon Scalable) 프로세서와 AI 응용프로그램 구동에 최적화된 엔비디아의 GPU를 각각 896개 사용해 구축했다. 프로세서의 코어 수는 CPU 당 20개로 전체 코어 수는 1만 7,920개(896*20)에 달한다. 엔비디아 GPU는 32GB V100이 탑재됐다. 전체 노드(nodes) 수는 448개로 구성된다.
린팩(LINPACK) 벤치마크로 측정한 최대 연산속도(Rmax)는 일초에 약 4,725조번 연산이 가능한 4.725페타플롭스다(petaFLOPS). 페타플롭스는 10의 15제곱으로 1,000조를 의미하며, 이러한 연산속도를 갖춘 슈퍼컴을 페타스케일 슈퍼컴이라고 한다. 전 세계 슈퍼컴 순위를 집계하는 TOP500에 등재된 모든 슈퍼컴은 페타 스케일 슈퍼컴퓨터로 구성되어 있다.
현재 슈퍼컴퓨터 1위는 미국 오크리지 국립연구소에 있는 서밋(Summit)으로 약 148.6페타플롭스의 처리속도(Rmax)를 가지고 있다. 텍사스주립대 오스틴 캠퍼스의 텍사스 첨단 컴퓨팅 센터에서 운영에 들어간 프론테라(Frontera)는 23.5페타플롭스의 연산속도(Rmax)를 제공하며, 전 세계 슈퍼컴퓨터 순위 5위에 올라 있으며 대학에 설치된 슈퍼컴 중에서 가장 빠른 것으로 알려져 있다.
TX-GAIA는 이러한 슈퍼컴과 비교하면 단순 연산속도는 비교도 되지 않을 만큼 느리지만, 심층신경망(DNN)을 작업을 처리하는 척도를 나타내는 AI 플롭은 약 100 AI 페타플롭스 전 세계 대학에 설치된 AI 슈퍼컴 중에서는 가장 빠르다는 것이 링컨 연구소 슈퍼컴 센터의 설명이다. 심층신경망은 대량의 데이터에서 패턴을 인식하는 방법을 배우는 AI 알고리즘 클래스의 일종이다.
심층신경망은 음성인식이나 컴퓨터 비전 등 다양한 분야에 활용되며, 연구 및 적용 환경이 다양해지면서 더욱더 많은 양의 데이터 세트(Data Set)를 처리해야 한다. 데이터 세트가 많아지면 상대적으로 처리하는 데 많은 시간이 걸릴 수밖에 없다. TX-GAIA는 엔비디아의 GPU 가속기를 활용해 이러한 심층신경망 연산작업을 빠르게 수행할 수 있도록 설계했다고 HPE와 링컨 연구소 슈퍼컴 센터는 전했다.
TX-GAIA는 매사추세츠 주 홀리 요크에 있는 링컨 연구소 슈퍼컴 센터의 에코팟(EcoPOD)이라는 새로운 모듈형 데이터 센터에 설치됐다. 이곳에서 MIT를 비롯한 다른 기관과 협업하는 TX-E1과 TOP500 목록에서 490위에 올라있는 TX-Greem 슈퍼컴 등과 함께 운영된다. 앞으로 TX-GAIA는 심층신경망을 사용하는 알고리즘을 포함한 머신러닝 알고리즘 훈련을 위해서 사용될 예정이다.
앞으로 TX-GAIA는 수십만 개의 이미지나 수년간의 음성 녹음 샘플로 이루어진 데라바이트 단위의 데이터를 분석하며, 머신러닝 알고리즘을 이용해 스스로 분석하는 솔루션을 스스로 알아낼 수 있는 훈련을 하게 된다. 이를 통해 기상 및 기후 예측 능력 개선, 의료 데이터 분석 가속화, 자율 시스템 구축, 합성 DNA 설계, 신소재(new material) 및 장치 개발, 인공지능은 물론이고 복잡한 연산과 대용량 데이터를 처리해야 하는 다양한 연구에 활용된다. ciokr@idg.co.kr