프론티어 슈퍼컴퓨터가 현재 지구상에서 가장 강력한 컴퓨터로 간주되지만, 이를 운영하는 오크리지 국립연구소(ORNL)는 아직 목마르다. 이번 달에 ORNL은 2027년 말 또는 2028년 초에 납품될 새로운 컴퓨터인 OLCF-6(현재 디스커버리라고 명명)에 대한
대규모 제안 요청을 발표했다. 기술 요구 사항 문서만 69쪽에 달한다.
"오크리지 리더십 컴퓨팅 시설에서는 과학 응용 분야를 위한 리더십급 슈퍼 컴퓨터를 구축하고 있다. 우리는 이러한 시스템을 수년 동안 하루 24시간씩 가동한다. 이러한 추세로는 프론티어의 한계가 다가온다. 휴대폰이나 노트북처럼 하드웨어가 마모되거나 쓸모없게 된다"라고 ORNL의 오크리지 리더십 컴퓨팅 시설(OLCF) 디스커버리 프로젝트 디렉터인 매트 시거는 말했다.
시거는 현재 상위 500대 슈퍼컴퓨터 목록에서 1위를 차지하고 있는 프론티어의 다음 시스템인 디스커버리를 필요로 한다고 전했다. "연구원들이 새로운 컴퓨터로 코드를 전환할 수 있도록 당분간 두 시스템을 동시에 운영할 계획"이라고 그는 덧붙였다.
5억 달러의 예산이 예상되는 가운데 디스커버리의 요구 사항은 광범위하다. 특히 "프론티어 기준선보다 리더십 컴퓨팅 및 데이터 과학 기능이 크게 향상되어야 한다"라고 표기돼 있다.
2021년에 설치된 프론티어는 막강한 능력을 자랑한다. 이 엑사스케일 슈퍼컴퓨터는 고속 슬링샷-11 인터커넥트를 갖춘 74개의 올림푸스 랙 HPE 캐비닛에 총 9,408개의 AMD 컴퓨팅 노드와 8,69만 9,904개의 코어를 탑재하고 있다. 소비 전력은 2만 2,786KW이며, 각 노드는 512GB의 DDR4 메모리에 접근한다.
디스커버리에 대해서는 이보다 더 나은 성능이 요구된다. 또 노드의 20%를 사용하는 소규모 워크로드부터 전체 시스템을 필요로 하는 워크로드까지 모두 지원해야 한다. 아울러 연결된 DOE 실험 사용자 시설 및 기타 ORNL LCF(리더십 컴퓨팅 시설) 인프라와 상호 운용 및 지원해야 한다.
이 밖에 프론티어의 서비스 수명이 끝나기 전에 운영되어야 하고, OLCF의 운영 및 유틸리티 예산 내에서 운영되어야 하며, 사용자에게 생산적인 프로그래밍 환경을 제공하고, "지속적으로 발전하여 생태계 전반의 에너지 효율성을 획기적으로 개선하는 데 앞장서야 한다"라는 주문도 있다.
AI 관련 주문도 빠지지 않았다. 디스커버리 RFP는 "국가적으로 중요한 과학, 에너지 및 보안 문제에 대한 발견을 가속화하기 위해 혁신적인 AI 기술을 탐색하고 통합하는 도메인 과학자와 애플리케이션 개발자를 지원하는 데 앞장서야 한다"라고 기술하고 있다.
또한 "전력망 및 원자로와 같은 복잡한 시스템의 역설계 및 제어부터, 종종 구조화되지 않은 고해상도 및 다중 모드 데이터 소스에서 텍스트와 이미지를 통합하는 생성형 AI 및 기본 모델에 이르기까지 광범위한 사용 사례를 구상하고 있다. AI 기반 컴퓨팅 캠페인과 워크플로우를 실행하면 시스템 아키텍처에 새로운 요구 사항이 발생하며, 더 많은 상호 연결 대역폭과 랜덤 읽기에 중점을 둔 매우 높은 I/O 작업 속도(IOPS)를 처리할 수 있는 최적화된 스토리지 계층이 필요할 수 있다"라고 이 기관은 밝혔다.
한편 OLCF는 제안서에 결과를 보고해야 하는 일련의 벤치마크를 제공하고 있다.
벤치마크 웹사이트에는 "제안자가 제안한 OLCF-6 시스템에 대한 벤치마크 결과를 추정하는 데 도움이 되도록" 프론티어를 포함한 기존 슈퍼컴퓨터의 출력 결과가 포함되어 있다.
또한 RFP에는 운영 체제 및 시스템과 워크로드 관리 시스템, 그리고 우선 순위가 높은 기술 요구 사항인 C, C++, 파이썬 및 포트란을 지원하는 개발 플랫폼을 포함한 필수 소프트웨어에 대한 광범위한 설명이 포함되어 있다. ciokr@idg.co.kr