Offcanvas

���������������

후지쯔, 슈퍼컴퓨터 ‘후가쿠’로 36큐비트 양자 시뮬레이터 개발 성공

후지쯔가 슈퍼컴퓨터 ‘후가쿠(Fugaku)’의 CPU ‘A64FX’를 탑재한 ‘후지쯔 수퍼컴퓨터 프라임HPC FX700(이하 프라임HPC FX700)’로 클러스터 시스템을 구축해 36큐비트(Qubit)의 양자 회로를 처리할 수 있는 컴퓨터 시뮬레이터(이하 양자 시뮬레이터)를 개발했다고 12일 밝혔다.    회사에 따르면 이 양자 시뮬레이터는 양자 시뮬레이터 소프트웨어 Qulacs를 고속으로 병렬 분산 처리함으로써 36큐비트 양자 연산에 있어 다른 기관(회사)의 주요 양자 시뮬레이터보다 약 2배의 성능을 달성한다. 이를 이용하면 수십년 후 실용화가 예상되는 양자 컴퓨터의 애플리케이션을 선행적으로 개발할 수 있다는 설명이다. 실제로 지난 1일부터 후지필름과 협업해 재료 분야에서 양자 컴퓨터 애플리케이션의 연구를 시작했다고 후지쯔는 덧붙였다. 후지쯔 관계자는 “앞으로 2022년 9월까지 40큐비트의 시뮬레이터를 개발하고, 금융, 신약 개발 등 다양한 분야의 고객들과 협력해 양자 애플리케이션의 연구 개발을 가속화시키는 등 양자 컴퓨터의 실용화를 위한 최선의 노력을 다할 것”이라고 밝혔다. ciokr@idg.co.kr

후지쯔 슈퍼컴퓨터 후가쿠

2022.04.12

후지쯔가 슈퍼컴퓨터 ‘후가쿠(Fugaku)’의 CPU ‘A64FX’를 탑재한 ‘후지쯔 수퍼컴퓨터 프라임HPC FX700(이하 프라임HPC FX700)’로 클러스터 시스템을 구축해 36큐비트(Qubit)의 양자 회로를 처리할 수 있는 컴퓨터 시뮬레이터(이하 양자 시뮬레이터)를 개발했다고 12일 밝혔다.    회사에 따르면 이 양자 시뮬레이터는 양자 시뮬레이터 소프트웨어 Qulacs를 고속으로 병렬 분산 처리함으로써 36큐비트 양자 연산에 있어 다른 기관(회사)의 주요 양자 시뮬레이터보다 약 2배의 성능을 달성한다. 이를 이용하면 수십년 후 실용화가 예상되는 양자 컴퓨터의 애플리케이션을 선행적으로 개발할 수 있다는 설명이다. 실제로 지난 1일부터 후지필름과 협업해 재료 분야에서 양자 컴퓨터 애플리케이션의 연구를 시작했다고 후지쯔는 덧붙였다. 후지쯔 관계자는 “앞으로 2022년 9월까지 40큐비트의 시뮬레이터를 개발하고, 금융, 신약 개발 등 다양한 분야의 고객들과 협력해 양자 애플리케이션의 연구 개발을 가속화시키는 등 양자 컴퓨터의 실용화를 위한 최선의 노력을 다할 것”이라고 밝혔다. ciokr@idg.co.kr

2022.04.12

인텔 ‘제온 및 Xe GPU’ 새 로드맵 공개 "효율성 코어 아키텍처도 적용"

인텔 팻 겔싱어 CEO가 제온 CPU 및 Xe GPU에 대한 로드맵을 공개했다. 월스트리트 애널리스트 미팅에서 공개된 이번 로드맵과 관련해 주목할 점은 인텔이 회사 역사상 처음으로 제온 프로세서 라인을 두 가지 아키텍처 유형으로 분기한다는 것이다.  두 유형은 각각 현재 디자인에서 이어지는 하나와, 엘더 레이크 하이브리드 아키텍처를 기반으로 하는 완전히 새로운 다른 하나다.  현 엘더 레이크는 기존 인텔 CPU와 다른 코어 디자인을 사용하고 있다. 지금까지 인텔 코어는 모두 동일했던 반면, 엘더 레이크는 2가지 유형의 코어를 사용한다. 하나는 성능을, 다른 하나는 전력 효율성을 담당하는 하이브리드 구조다. 이러한 구조는 Arm이 몇 년 전부터 자사 CPU에 적용시켜온 바 있다.  로드맵에 따르면 차세대 제온 프로세서의 코드명은 사파이어 래피즈로 알려져 있으며 올해 말 출시될 예정이다. 이어 2023년 에머랄드 래피즈, 2024년 그래나이트 래피즈가 등장한다. 효율성 코어를 내장한 하이브리드 아키텍처의 제온 프로세서 2세대인 시에라 포레스트라는 2024년 출시될 예정이다. 한편 제온 제품군의 로드랩이 두 개의 트랙으로 나뉘는 이번 결정은 인텔이 7nm 인텔 3 노드의 개발 상황에 확신을 가지고 있음을 시사한다. 겔싱어는 2024년 등장할 그래나이트 래피즈와 시에라 포레스트가 시장 요구를 보다 효과적으로 충족하고 의심의 여지가 없는 최고의 성능을 구현할 것이라고 말했다.  이 밖에 인텔은 슈퍼컴퓨팅 분야와 관련해 제온 CPU와 인텔 Xe GPU를 단일 제온 프로세서로 결합하는 팰콘 쇼어라는 새로운 아키텍처를 발표했다. 회사는 팰콘 쇼어가 현재 세대 제품에 비해 5배 더 높은 와트당 성능, 5배 더 높은 컴퓨팅 밀도, 5배 더 큰 메모리 용량 및 대역폭을 제공할 것이라고 주장했다. 단 이 제품이 등장할 시기는 2024년 이후일 전망이다.  GPU 기반 오디오 인코더 인텔은 GPU이 새로운 용도를 공개하기도 했다...

제온 인텔 서버 슈퍼컴퓨터 Xe GPU

2022.02.25

인텔 팻 겔싱어 CEO가 제온 CPU 및 Xe GPU에 대한 로드맵을 공개했다. 월스트리트 애널리스트 미팅에서 공개된 이번 로드맵과 관련해 주목할 점은 인텔이 회사 역사상 처음으로 제온 프로세서 라인을 두 가지 아키텍처 유형으로 분기한다는 것이다.  두 유형은 각각 현재 디자인에서 이어지는 하나와, 엘더 레이크 하이브리드 아키텍처를 기반으로 하는 완전히 새로운 다른 하나다.  현 엘더 레이크는 기존 인텔 CPU와 다른 코어 디자인을 사용하고 있다. 지금까지 인텔 코어는 모두 동일했던 반면, 엘더 레이크는 2가지 유형의 코어를 사용한다. 하나는 성능을, 다른 하나는 전력 효율성을 담당하는 하이브리드 구조다. 이러한 구조는 Arm이 몇 년 전부터 자사 CPU에 적용시켜온 바 있다.  로드맵에 따르면 차세대 제온 프로세서의 코드명은 사파이어 래피즈로 알려져 있으며 올해 말 출시될 예정이다. 이어 2023년 에머랄드 래피즈, 2024년 그래나이트 래피즈가 등장한다. 효율성 코어를 내장한 하이브리드 아키텍처의 제온 프로세서 2세대인 시에라 포레스트라는 2024년 출시될 예정이다. 한편 제온 제품군의 로드랩이 두 개의 트랙으로 나뉘는 이번 결정은 인텔이 7nm 인텔 3 노드의 개발 상황에 확신을 가지고 있음을 시사한다. 겔싱어는 2024년 등장할 그래나이트 래피즈와 시에라 포레스트가 시장 요구를 보다 효과적으로 충족하고 의심의 여지가 없는 최고의 성능을 구현할 것이라고 말했다.  이 밖에 인텔은 슈퍼컴퓨팅 분야와 관련해 제온 CPU와 인텔 Xe GPU를 단일 제온 프로세서로 결합하는 팰콘 쇼어라는 새로운 아키텍처를 발표했다. 회사는 팰콘 쇼어가 현재 세대 제품에 비해 5배 더 높은 와트당 성능, 5배 더 높은 컴퓨팅 밀도, 5배 더 큰 메모리 용량 및 대역폭을 제공할 것이라고 주장했다. 단 이 제품이 등장할 시기는 2024년 이후일 전망이다.  GPU 기반 오디오 인코더 인텔은 GPU이 새로운 용도를 공개하기도 했다...

2022.02.25

퓨어스토리지-메타, 파트너십 체결… "AI 슈퍼컴퓨터 지원"

퓨어스토리지가 메타(옛 페이스북)의 인공지능(AI) 리서치 슈퍼클러스터(Research SuperCluster; RSC)를 협력 지원한다고 1월 27일 밝혔다.  메타는 AI 연구원들이 수 조 개의 사례를 통한 학습과 수 백 개의 언어 연구, 그리고 텍스트, 사진 및 영상의 유기적인 통합 분석을 통해 새로운 AR(증강현실) 도구 등 고성능의 AI 모델을 개발할 수 있도록 RSC를 개발한다고 발표했다. 궁극적으로, 메타는 RSC를 통해 차세대 주요 컴퓨팅 플랫폼인 메타버스에 핵심적인 기술인 AI 기반 애플리케이션 및 제품 등을 구축할 계획이다.  회사에 따르면 RSC를 위해 강력한 성능 및 확장성을 제공하는 스토리지가 필요했던 메타는 퓨어스토리지를 스토리지 파트너로 선정했다. 그리고 간소성, 안정성 및 지속가능성을 갖춘 퓨어스토리지의 플래시어레이(FlashArray) 및 플래시블레이드(FlashBlade)를 통해 정형 및 비정형 데이터 모두를 신속하게 분석할 수 있는 탁월한 성능을 RSC에 제공할 수 있게 되었다고 업체 측은 설명했다.  퓨어스토리지는 오랫동안 메타의 기술 파트너로 인정받으며 지난 2017년에는 메타의 1세대 AI 연구 인프라스트럭처의 설계를 도왔고, 그 이후로도 지속적으로 메타의 AI 연구를 위해 협력해 왔다. 퓨어스토리지는 최소한의 풋프린트로 고성능을 발휘할 수 있으며, 최적의 설계를 갖춘 환경 친화적인 솔루션들로 대규모 AI 워크로드들을 지원하고 있다. 이를 통해 고객들이 방대한 양의 정형 및 비정형 데이터를 신속하고 안정적이며 효율적으로 처리할 수 있도록 돕고 있다.  메타의 RSC에 활용된 플래시어레이//C(FlashArray//C)는 엔터프라이즈에 최적화된 대용량 플랫폼으로, 가장 까다로운 조건을 갖춘 환경에서도 검증된 99.9999%의 가용성, 일관적인 밀리초(1,000분의 1초) 단위의 레이턴시 및 하이퍼 통합(hyper consolidation)을 지원한다. 또한, 고유한 QLC...

퓨어스토리지 메타 슈퍼컴퓨터

2022.01.27

퓨어스토리지가 메타(옛 페이스북)의 인공지능(AI) 리서치 슈퍼클러스터(Research SuperCluster; RSC)를 협력 지원한다고 1월 27일 밝혔다.  메타는 AI 연구원들이 수 조 개의 사례를 통한 학습과 수 백 개의 언어 연구, 그리고 텍스트, 사진 및 영상의 유기적인 통합 분석을 통해 새로운 AR(증강현실) 도구 등 고성능의 AI 모델을 개발할 수 있도록 RSC를 개발한다고 발표했다. 궁극적으로, 메타는 RSC를 통해 차세대 주요 컴퓨팅 플랫폼인 메타버스에 핵심적인 기술인 AI 기반 애플리케이션 및 제품 등을 구축할 계획이다.  회사에 따르면 RSC를 위해 강력한 성능 및 확장성을 제공하는 스토리지가 필요했던 메타는 퓨어스토리지를 스토리지 파트너로 선정했다. 그리고 간소성, 안정성 및 지속가능성을 갖춘 퓨어스토리지의 플래시어레이(FlashArray) 및 플래시블레이드(FlashBlade)를 통해 정형 및 비정형 데이터 모두를 신속하게 분석할 수 있는 탁월한 성능을 RSC에 제공할 수 있게 되었다고 업체 측은 설명했다.  퓨어스토리지는 오랫동안 메타의 기술 파트너로 인정받으며 지난 2017년에는 메타의 1세대 AI 연구 인프라스트럭처의 설계를 도왔고, 그 이후로도 지속적으로 메타의 AI 연구를 위해 협력해 왔다. 퓨어스토리지는 최소한의 풋프린트로 고성능을 발휘할 수 있으며, 최적의 설계를 갖춘 환경 친화적인 솔루션들로 대규모 AI 워크로드들을 지원하고 있다. 이를 통해 고객들이 방대한 양의 정형 및 비정형 데이터를 신속하고 안정적이며 효율적으로 처리할 수 있도록 돕고 있다.  메타의 RSC에 활용된 플래시어레이//C(FlashArray//C)는 엔터프라이즈에 최적화된 대용량 플랫폼으로, 가장 까다로운 조건을 갖춘 환경에서도 검증된 99.9999%의 가용성, 일관적인 밀리초(1,000분의 1초) 단위의 레이턴시 및 하이퍼 통합(hyper consolidation)을 지원한다. 또한, 고유한 QLC...

2022.01.27

“무려 5엑사플롭스, 단숨에 톱500 목록 1위”··· 메타, AI용 슈퍼컴퓨터 개발 중

페이스북의 모회사 메타(Meta)가 세계 최대 성능의 AI 슈퍼 컴퓨터를 구축하고 있다고 밝혔다. 메타버스 프로젝트 구축에 필요한 머신러닝 및 자연어 처리를 지원하기 위한 용도다. RSC(Research Super Computer)라고 불리는 이 새로운 시스템은 1만 6,000개의 엔비디아 A100 GPU와 4,000개의 AMD 에픽 롬 7742 프로세서를 탑재한다. 노드당 8개의 GPU 칩과 2개의 에픽 마이크로프로세서가 있는 2,000개의 엔비디아 DGX-A100 노드가 존재하는 구조다. 올해 말 구축 완료될 예정이다.  회사에 따르면 RSC는 이미 부분적으로 구축된 상태다. 760개의 DGX-A100 시스템이 배치돼 있다. 메타의 연구진은 이미 자연어 처리(NLP) 및 연구용 컴퓨터 비전을 위한 대규모 모델을 교육하기 시작했다. 궁극적으로는 수조 개의 매개변수가 있는 모델을 교육하는 것이 목표다.  마크 주커버그 CEO는 “메타버스를 위해 구축하는 경험에는 엄청난 컴퓨팅 성능이 필요하다. RSC는 수조 개의 예제에서 학습하고 수백 가지 언어 등을 이해할 수 있는 새로운 AI 모델을 가능하게 할 것이다”라고 밝혔다.  메타가 HPC 시스템 전문 벤더인 펭귄컴퓨팅과 협력해 구축하고 있는 RSC는 FP16 및 FP32의 혼합 정밀 처리에서 5엑사플롭스의 최고 성능을 기록할 것으로 예상된다. 현재 톱500 슈퍼 컴퓨터 1위의 성능은 442페타플롭스/s다. 단숨에 1위를 차지하게 되는 셈이다. RSC의 소재지는 알려지지 않았다.  메타의 기술 프로그램 관리자인 케빈 리와 소프트웨어 엔지니어인 수보 센굽타는 블로그 포스트를 통해 “RSC가 새롭고 더 나은 AI 모델을 구축하는 데 도움이 될 것이다. 수백 가지 다른 언어로 작업하고, 텍스트, 이미지 및 비디오를 함께 매끄럽게 분석하며, 새로운 증강현실 도구를 개발할 수 있게 해줄 것”이라고 밝혔다.  그들은 이어 “예를 들어 다른 언어를 사용하는 대규모 그룹...

메타 페이스북 슈퍼컴퓨터 DGX-A100 RSC

2022.01.26

페이스북의 모회사 메타(Meta)가 세계 최대 성능의 AI 슈퍼 컴퓨터를 구축하고 있다고 밝혔다. 메타버스 프로젝트 구축에 필요한 머신러닝 및 자연어 처리를 지원하기 위한 용도다. RSC(Research Super Computer)라고 불리는 이 새로운 시스템은 1만 6,000개의 엔비디아 A100 GPU와 4,000개의 AMD 에픽 롬 7742 프로세서를 탑재한다. 노드당 8개의 GPU 칩과 2개의 에픽 마이크로프로세서가 있는 2,000개의 엔비디아 DGX-A100 노드가 존재하는 구조다. 올해 말 구축 완료될 예정이다.  회사에 따르면 RSC는 이미 부분적으로 구축된 상태다. 760개의 DGX-A100 시스템이 배치돼 있다. 메타의 연구진은 이미 자연어 처리(NLP) 및 연구용 컴퓨터 비전을 위한 대규모 모델을 교육하기 시작했다. 궁극적으로는 수조 개의 매개변수가 있는 모델을 교육하는 것이 목표다.  마크 주커버그 CEO는 “메타버스를 위해 구축하는 경험에는 엄청난 컴퓨팅 성능이 필요하다. RSC는 수조 개의 예제에서 학습하고 수백 가지 언어 등을 이해할 수 있는 새로운 AI 모델을 가능하게 할 것이다”라고 밝혔다.  메타가 HPC 시스템 전문 벤더인 펭귄컴퓨팅과 협력해 구축하고 있는 RSC는 FP16 및 FP32의 혼합 정밀 처리에서 5엑사플롭스의 최고 성능을 기록할 것으로 예상된다. 현재 톱500 슈퍼 컴퓨터 1위의 성능은 442페타플롭스/s다. 단숨에 1위를 차지하게 되는 셈이다. RSC의 소재지는 알려지지 않았다.  메타의 기술 프로그램 관리자인 케빈 리와 소프트웨어 엔지니어인 수보 센굽타는 블로그 포스트를 통해 “RSC가 새롭고 더 나은 AI 모델을 구축하는 데 도움이 될 것이다. 수백 가지 다른 언어로 작업하고, 텍스트, 이미지 및 비디오를 함께 매끄럽게 분석하며, 새로운 증강현실 도구를 개발할 수 있게 해줄 것”이라고 밝혔다.  그들은 이어 “예를 들어 다른 언어를 사용하는 대규모 그룹...

2022.01.26

'온디맨드 슈퍼컴퓨터' 애저 HPC란?

오래 전, 누군가 온 세계에 필요한 컴퓨터는 단 5대라고 말했다고 한다. 마이크로소프트 애저, 아마존 웹 서비스, 구글 클라우드 플랫폼 등은 모두 대규모 확장이 가능한 컴퓨팅 클러스터로, 각 서버와 각 데이터센터는 또 하나의 구성요소이고, 이들이 모여 거대한, 전 지구급 규모의 컴퓨터가 된다고 말할 수도 있다. 사실 클라우드를 움직이는 기술의 상당수는 원래 일반적인 기성품 하드웨어를 사용해서 슈퍼컴퓨터를 만들고 운용하기 위해 개발된 기술이다.    클라우드를 활용해 문제를 해결하는 동안에만 존재하는 HPC(High Performance Computing) 시스템을 만들고 구축하고 실행하면 좋지 않을까? 웨타 데지털(Weta Digital)의 영화 제작자들이 렌더 팜(render farm: 킹콩, 호빗과 같은 영화의 CGI 효과를 위해 구축된 하드웨어 서버 룸)에 대해 생각하는 것과 거의 똑 같은 방식으로 클라우드를 생각하면 된다. 렌더 팜은 영화 제작에 사용되지 않을 때는 뉴질랜드 정부를 위한 임시 슈퍼컴퓨터로 활용된다.  퍼블릭 클라우드의 첫 대규모 사례 연구는 이 부분, 즉 과거라면 온프레미스 HPC 하드웨어를 사용했을 일시적인 폭발적 용량을 위해 퍼블릭 클라우드를 사용하는 데 초점을 맞췄다. 이를 통해 데이터센터 공간, 스토리지, 전력에 대한 투자 없이 HPC를 이용해 상당한 비용을 절감할 수 있다는 것을 확인했다.   애저 HPC 소개  HPC 기능은 애저를 비롯한 클라우드에서 여전히 중요한 기능이다. 클라우드는 더 이상 일반 하드웨어에 의존하지 않고 이제 HPC에 초점을 둔 컴퓨팅 인스턴스를 제공하고 HPC 솔루션 업체와 협력해 전문 툴을 서비스로 제공한다. 특히 HPC를 요구사항에 따라 확장 가능한, 빠르고 쉽게 실행할 수 있는 동적 서비스로 취급한다.  애저의 HPC 툴은 마이크로소프트가 말하는 “빅 컴퓨팅”을 제공하는 데 초점을 둔 아키텍처 원칙 모음이라고 생각하는 것이 가장 정확할 ...

HPC 슈퍼컴퓨터 매니지드서비스 사이클클라우드 애저

2022.01.17

오래 전, 누군가 온 세계에 필요한 컴퓨터는 단 5대라고 말했다고 한다. 마이크로소프트 애저, 아마존 웹 서비스, 구글 클라우드 플랫폼 등은 모두 대규모 확장이 가능한 컴퓨팅 클러스터로, 각 서버와 각 데이터센터는 또 하나의 구성요소이고, 이들이 모여 거대한, 전 지구급 규모의 컴퓨터가 된다고 말할 수도 있다. 사실 클라우드를 움직이는 기술의 상당수는 원래 일반적인 기성품 하드웨어를 사용해서 슈퍼컴퓨터를 만들고 운용하기 위해 개발된 기술이다.    클라우드를 활용해 문제를 해결하는 동안에만 존재하는 HPC(High Performance Computing) 시스템을 만들고 구축하고 실행하면 좋지 않을까? 웨타 데지털(Weta Digital)의 영화 제작자들이 렌더 팜(render farm: 킹콩, 호빗과 같은 영화의 CGI 효과를 위해 구축된 하드웨어 서버 룸)에 대해 생각하는 것과 거의 똑 같은 방식으로 클라우드를 생각하면 된다. 렌더 팜은 영화 제작에 사용되지 않을 때는 뉴질랜드 정부를 위한 임시 슈퍼컴퓨터로 활용된다.  퍼블릭 클라우드의 첫 대규모 사례 연구는 이 부분, 즉 과거라면 온프레미스 HPC 하드웨어를 사용했을 일시적인 폭발적 용량을 위해 퍼블릭 클라우드를 사용하는 데 초점을 맞췄다. 이를 통해 데이터센터 공간, 스토리지, 전력에 대한 투자 없이 HPC를 이용해 상당한 비용을 절감할 수 있다는 것을 확인했다.   애저 HPC 소개  HPC 기능은 애저를 비롯한 클라우드에서 여전히 중요한 기능이다. 클라우드는 더 이상 일반 하드웨어에 의존하지 않고 이제 HPC에 초점을 둔 컴퓨팅 인스턴스를 제공하고 HPC 솔루션 업체와 협력해 전문 툴을 서비스로 제공한다. 특히 HPC를 요구사항에 따라 확장 가능한, 빠르고 쉽게 실행할 수 있는 동적 서비스로 취급한다.  애저의 HPC 툴은 마이크로소프트가 말하는 “빅 컴퓨팅”을 제공하는 데 초점을 둔 아키텍처 원칙 모음이라고 생각하는 것이 가장 정확할 ...

2022.01.17

칼럼ㅣ‘애플 카’는 1조 시간의 관심 경제를 노리고 있다

모건 스탠리는 2040년까지 사람들이 자동차 안에서 보내는 시간이 1조 2,000억 시간에 이를 것이라고 추산했다.  물론 여기서의 ‘차’는 단순한 자동차 그 이상이다. 그리고 애플이 이러한 자동차를 판매하기 시작한다면(이를 개발하기 위해 수십억 달러를 투자하고 있다), 아이폰(iPhone)의 사례에서 봤던 것처럼 ‘운송’의 미래도 달라질 것이라는 점을 예상할 수 있을 것이다.    ‘자동차’의 문제가 아니라 ‘관심’의 문제다 중요한 건 사람들의 ‘관심’이다. 유명 애플 애널리스트 케이티 휴버티를 포함한 모건 스탠리 애널리스트 팀은 사람들이 자동차 안에서 보내는 시간이 현재 6,000억 시간에서 2040년까지 1조 2,000억 시간에 달할 것이라고 추산했다(이는 과소평가일 수 있다는 의견도 있다). 지금 당장은 데드타임이나 마찬가지다. 현재는 단순하게 라디오와 팟캐스트를 듣고, 약간의 음악을 즐기며, (운전자가 아닌 탑승자라면) 책을 읽거나 영화를 보거나 게임을 할 수 있다. 즉, 자동차는 ‘생산적인 공간’을 위해 설계되지 않았다. 자동차의 전체 설계 패러다임은 편안한 이동수단의 기능을 중심으로 구축됐다.  하지만 미래의 자동차는 그 이상일 것이다. 모건 스탠리는 자동차가 물리적 이동을 관리하고 사용자 경험을 유지하는 슈퍼컴퓨터를 기반으로 몰입형 VR 경험을 제공할 것이라고 예측했다. 소프트웨어, 앱, 이동 중 경험으로 증강되리라 간주되는 경험이다. 모건 스탠리는 이를 ‘모바일 메타버스(Mobile Metaverse)’라고 언급하면서, “완전한 자율주행은 모바일(이동수단용) 앱 스토어의 가능성을 여는 데 매우 중요하다”라고 말했다.  기존 틀에서 벗어나라 모건 스탠리의 최근 보고서는 다음과 같은 질문을 던진다. ‘애플이 페달과 핸들이 있는 자동차를 제공할 것인가?’, ‘테슬라가 애플 또는 도요타/VW를 장기적으로 가장 큰 경쟁자로 보는가?’, ‘애플카가 테슬라의 모델을 검증할까? 위협할까? 아니면 둘 다일...

애플 애플 카 자동차 자율주행차 테슬라 관심 경제 슈퍼컴퓨터 가상현실 증강현실 모바일 메타버스

2022.01.14

모건 스탠리는 2040년까지 사람들이 자동차 안에서 보내는 시간이 1조 2,000억 시간에 이를 것이라고 추산했다.  물론 여기서의 ‘차’는 단순한 자동차 그 이상이다. 그리고 애플이 이러한 자동차를 판매하기 시작한다면(이를 개발하기 위해 수십억 달러를 투자하고 있다), 아이폰(iPhone)의 사례에서 봤던 것처럼 ‘운송’의 미래도 달라질 것이라는 점을 예상할 수 있을 것이다.    ‘자동차’의 문제가 아니라 ‘관심’의 문제다 중요한 건 사람들의 ‘관심’이다. 유명 애플 애널리스트 케이티 휴버티를 포함한 모건 스탠리 애널리스트 팀은 사람들이 자동차 안에서 보내는 시간이 현재 6,000억 시간에서 2040년까지 1조 2,000억 시간에 달할 것이라고 추산했다(이는 과소평가일 수 있다는 의견도 있다). 지금 당장은 데드타임이나 마찬가지다. 현재는 단순하게 라디오와 팟캐스트를 듣고, 약간의 음악을 즐기며, (운전자가 아닌 탑승자라면) 책을 읽거나 영화를 보거나 게임을 할 수 있다. 즉, 자동차는 ‘생산적인 공간’을 위해 설계되지 않았다. 자동차의 전체 설계 패러다임은 편안한 이동수단의 기능을 중심으로 구축됐다.  하지만 미래의 자동차는 그 이상일 것이다. 모건 스탠리는 자동차가 물리적 이동을 관리하고 사용자 경험을 유지하는 슈퍼컴퓨터를 기반으로 몰입형 VR 경험을 제공할 것이라고 예측했다. 소프트웨어, 앱, 이동 중 경험으로 증강되리라 간주되는 경험이다. 모건 스탠리는 이를 ‘모바일 메타버스(Mobile Metaverse)’라고 언급하면서, “완전한 자율주행은 모바일(이동수단용) 앱 스토어의 가능성을 여는 데 매우 중요하다”라고 말했다.  기존 틀에서 벗어나라 모건 스탠리의 최근 보고서는 다음과 같은 질문을 던진다. ‘애플이 페달과 핸들이 있는 자동차를 제공할 것인가?’, ‘테슬라가 애플 또는 도요타/VW를 장기적으로 가장 큰 경쟁자로 보는가?’, ‘애플카가 테슬라의 모델을 검증할까? 위협할까? 아니면 둘 다일...

2022.01.14

블로그 | 클라우드 슈퍼컴퓨터가 부상한다

 영국 소재 클라우드 워크로드 관리 전문업체 '옐로우독(YellowDog)'가 여러 클라우드 서버를 이용해 가상 슈퍼컴퓨터를 만드는 데 성공했다. 최고 성능을 낸 약 10분간 320만 개 이상의 가상 CPU를 활용했다. 더 자세히 보면 클라우드 서버 중 하나가 AWS 96-코어 C5 24 인스턴스로, 시간당 1.6달러가 드는데, 6시간 사용했다.   옐로우독이 이렇게 여러 클라우드 서버를 결합한 것은 방대한 분산 슈퍼컴퓨터를 이용해 싱글 클러스터로 마약 탐지 애플리케이션을 실행해 많은 문제를 빠르게 해결하기 위해서였다. 비용은 약 6만 달러가 들었다. 너무 비용이 크다고 생각할 수도 있지만 실제로는 그렇지 않다. 필자는 80~90년대 슈퍼컴퓨터를 사용한 경험이 있는데, 옐로우독 사례보다 10배 정도 더 많은 작업을 처리하긴 했지만, 최소 수백만 달러짜리 청구서를 받곤 했다. 반면 옐로우독은 온디멘드 클라우드 기반 슈퍼컴퓨터를 이용해 불과 6시간 만에 3억 3700만 개 화합물을 분석했다. 오늘날 이런 고성능 컴퓨팅을 클라우드 기반 플랫폼으로 사용하는 경우가 점점 늘어나고 있다. 특히 대기업은 전통적인 업무용 애플리케이션을 실행하고 데이터를 저장하는 데 있어 클라우드가 경제적이며, 특수 제작된 고가의 슈퍼컴퓨터를 클라우드에서도 구현할 수 있음을 깨닫고 있다. 더우기 잇점은 전통적인 슈퍼컴퓨터를 대체하는 것만이 아니다. 고급 분석에 들어가는 시간도 줄일 수 있는데, 예를 들면 마약 탐지 애플리케이션, 조사와 의료 연구, 고급 시뮬레이션를 비롯한 컴퓨트 집약적인 애플리케이션 작업이 대표적이다. 중소기업도 더는 슈퍼컴퓨터의 가격표 때문에 주저하지 않아도 된다. 이를 이용하면 체급을 뛰어넘어 역량을 몇 배씩 증폭하는 기술로 활용할 수 있고, 대기업은 생각할 수 없는 시장 혁신을 이룰 수 있다. 이러한 파괴적인 현상이 몇 년 내에 더 일상화될 것으로 보인다. 지난 100년 이상 시장을 선도했던 대기업의 영역을 중소기업이 점차 잠식할 것이다. ...

슈퍼컴퓨터 클라우드

2021.12.02

 영국 소재 클라우드 워크로드 관리 전문업체 '옐로우독(YellowDog)'가 여러 클라우드 서버를 이용해 가상 슈퍼컴퓨터를 만드는 데 성공했다. 최고 성능을 낸 약 10분간 320만 개 이상의 가상 CPU를 활용했다. 더 자세히 보면 클라우드 서버 중 하나가 AWS 96-코어 C5 24 인스턴스로, 시간당 1.6달러가 드는데, 6시간 사용했다.   옐로우독이 이렇게 여러 클라우드 서버를 결합한 것은 방대한 분산 슈퍼컴퓨터를 이용해 싱글 클러스터로 마약 탐지 애플리케이션을 실행해 많은 문제를 빠르게 해결하기 위해서였다. 비용은 약 6만 달러가 들었다. 너무 비용이 크다고 생각할 수도 있지만 실제로는 그렇지 않다. 필자는 80~90년대 슈퍼컴퓨터를 사용한 경험이 있는데, 옐로우독 사례보다 10배 정도 더 많은 작업을 처리하긴 했지만, 최소 수백만 달러짜리 청구서를 받곤 했다. 반면 옐로우독은 온디멘드 클라우드 기반 슈퍼컴퓨터를 이용해 불과 6시간 만에 3억 3700만 개 화합물을 분석했다. 오늘날 이런 고성능 컴퓨팅을 클라우드 기반 플랫폼으로 사용하는 경우가 점점 늘어나고 있다. 특히 대기업은 전통적인 업무용 애플리케이션을 실행하고 데이터를 저장하는 데 있어 클라우드가 경제적이며, 특수 제작된 고가의 슈퍼컴퓨터를 클라우드에서도 구현할 수 있음을 깨닫고 있다. 더우기 잇점은 전통적인 슈퍼컴퓨터를 대체하는 것만이 아니다. 고급 분석에 들어가는 시간도 줄일 수 있는데, 예를 들면 마약 탐지 애플리케이션, 조사와 의료 연구, 고급 시뮬레이션를 비롯한 컴퓨트 집약적인 애플리케이션 작업이 대표적이다. 중소기업도 더는 슈퍼컴퓨터의 가격표 때문에 주저하지 않아도 된다. 이를 이용하면 체급을 뛰어넘어 역량을 몇 배씩 증폭하는 기술로 활용할 수 있고, 대기업은 생각할 수 없는 시장 혁신을 이룰 수 있다. 이러한 파괴적인 현상이 몇 년 내에 더 일상화될 것으로 보인다. 지난 100년 이상 시장을 선도했던 대기업의 영역을 중소기업이 점차 잠식할 것이다. ...

2021.12.02

“전 세계 TOP 500 슈퍼컴퓨터의 70%가 엔비디아 기술로 구동”

엔비디아에 따르면 '슈퍼컴퓨팅 컨퍼런스 2021(SC21)'에서 발표된 전 세계 슈퍼컴퓨터 톱 500 리스트 중 70%에 달하는 355개 시스템이 엔비디아 기술로 가속되고 있다. 새로 구축된 시스템의 90% 이상은 엔비디아의 기술력을 채택하고 있다. 또한 에너지 효율이 가장 높은 시스템을 선별하는 그린500(Green500)의 상위 25개 시스템 중 23개가 엔비디아 기술로 구동되고 있는 것으로 나타났다. 평균적으로 엔비디아 GPU 기반 슈퍼컴퓨터는 GPU를 사용하지 않는 그린500 시스템 대비 3.5배 높은 에너지 효율을 제공한다.   ​​ 마이크로소프트의 GPU 가속 애저(Azure) 슈퍼컴퓨터는 10위에 오르면서 클라우드 기반 시스템으로는 처음으로 10위권에 진입했다. AI는 과학 연구를 위한 컴퓨팅을 혁신하고 있다. 최근 고성능컴퓨팅(HPC)과 머신러닝을 활용한 논문의 수가 급증해 2018년에 약 600편 정도 제출되었던 관련 논문이 2020년에는 5,000편으로 증가했다. HPL-AI는 혼합정밀도연산(딥러닝과 다양한 과학 연구, 상업적 활용의 기초)을 사용하면서도 배정밀도 연산의 정확도(전통적 HPC 벤치마크의 표준 측정자 역할)를 온전히 제공하는 HPC와 AI 융합형 워크로드의 새로운 벤치마크다. MLPerf HPC는 슈퍼컴퓨터상의 시뮬레이션을 AI로 가속, 개선하는 컴퓨팅 스타일을 평가한다. HPC 센터의 주요 워크로드인 천체물리학(Cosmoflow)과 날씨(Deepcam), 분자동역학(Opencatalyst)을 바탕으로 성능을 측정한다. 엔비디아는 GPU 가속 프로세싱, 스마트 네트워킹, GPU 최적화 애플리케이션, AI와 HPC 융합 지원 라이브러리들로 풀 스택을 커버한다. 이 같은 접근법을 통해 워크로드를 가속하고 과학적 혁신을 이룩할 수 있었다고 업체 측은 설명했다. 다양한 활용 사례에서 GPU의 병렬 처리 기능과 2,500개 이상의 GPU 최적화 애플리케이션이 결합하면 HPC 작업에 소요되는 시간을 몇 주에서 몇 시간...

슈퍼컴퓨터 엔비디아

2021.11.19

엔비디아에 따르면 '슈퍼컴퓨팅 컨퍼런스 2021(SC21)'에서 발표된 전 세계 슈퍼컴퓨터 톱 500 리스트 중 70%에 달하는 355개 시스템이 엔비디아 기술로 가속되고 있다. 새로 구축된 시스템의 90% 이상은 엔비디아의 기술력을 채택하고 있다. 또한 에너지 효율이 가장 높은 시스템을 선별하는 그린500(Green500)의 상위 25개 시스템 중 23개가 엔비디아 기술로 구동되고 있는 것으로 나타났다. 평균적으로 엔비디아 GPU 기반 슈퍼컴퓨터는 GPU를 사용하지 않는 그린500 시스템 대비 3.5배 높은 에너지 효율을 제공한다.   ​​ 마이크로소프트의 GPU 가속 애저(Azure) 슈퍼컴퓨터는 10위에 오르면서 클라우드 기반 시스템으로는 처음으로 10위권에 진입했다. AI는 과학 연구를 위한 컴퓨팅을 혁신하고 있다. 최근 고성능컴퓨팅(HPC)과 머신러닝을 활용한 논문의 수가 급증해 2018년에 약 600편 정도 제출되었던 관련 논문이 2020년에는 5,000편으로 증가했다. HPL-AI는 혼합정밀도연산(딥러닝과 다양한 과학 연구, 상업적 활용의 기초)을 사용하면서도 배정밀도 연산의 정확도(전통적 HPC 벤치마크의 표준 측정자 역할)를 온전히 제공하는 HPC와 AI 융합형 워크로드의 새로운 벤치마크다. MLPerf HPC는 슈퍼컴퓨터상의 시뮬레이션을 AI로 가속, 개선하는 컴퓨팅 스타일을 평가한다. HPC 센터의 주요 워크로드인 천체물리학(Cosmoflow)과 날씨(Deepcam), 분자동역학(Opencatalyst)을 바탕으로 성능을 측정한다. 엔비디아는 GPU 가속 프로세싱, 스마트 네트워킹, GPU 최적화 애플리케이션, AI와 HPC 융합 지원 라이브러리들로 풀 스택을 커버한다. 이 같은 접근법을 통해 워크로드를 가속하고 과학적 혁신을 이룩할 수 있었다고 업체 측은 설명했다. 다양한 활용 사례에서 GPU의 병렬 처리 기능과 2,500개 이상의 GPU 최적화 애플리케이션이 결합하면 HPC 작업에 소요되는 시간을 몇 주에서 몇 시간...

2021.11.19

블로그ㅣ‘도조(Dojo)’ 슈퍼컴에 대한 테슬라의 주장은 타당한가?

정확하다면, 플롭스(FLOPS)로 측정한 테슬라의 자체 개발 ‘도조(Dojo)’ 슈퍼컴퓨터의 성능은 전 세계에서 가장 빠른 슈퍼컴퓨터를 2배 이상 능가한다.  자율주행차는 실시간으로 도로 상황을 인식하고, 결정을 내리며, 적절한 조치를 취할 수 있는 능력을 갖춰야 한다. 이를 위해서는 초고속 처리 능력과 함께 자동차가 ‘학습’할 수 있도록 하는 온보드 인공지능이 필요하다.    테슬라는 지난 2019년 맞춤형 AI 칩을 공개했다. 그리고 곧 이 칩을 사용해 자동차를 제조하기 시작했다. 이제 테슬라는 도조 슈퍼컴퓨터의 성능을 극대화하기 위해 자체 개발한 AI 반도체(D1)를 선보였다.  회사에 따르면 D1은 362테라플롭스(Tflops)의 처리 능력을 갖추고 있다. 이는 초당 362조 번의 부동 소수점 연산(FLOPS)을 수행할 수 있다는 의미라고 테슬라는 말했다.  이제 D1 칩 25개를 하나의 학습용 타일(training tile)에 배치하고, 여러 서버를 통해 120개의 학습용 타일을 결합하는 걸 상상해보라. 이게 바로 테슬라가 자사의 자율주행차를 위해 도조 슈퍼컴퓨터로 하는 일이다. 그리고 9페타플롭스(Pflops)의 컴퓨팅 성능을 갖춘 각 학습용 타일에서 (필자의 부정확한 계산에 따르자면) 도조는 1.08엑사플롭스(Exaflops)의 성능을 구현한다(테슬라에서는 1.1엑사플롭스라고 말하고 있다).  이 정도의 성능은 도조를 현재 전 세계에서 가장 빠른 슈퍼컴퓨터인 ‘후가쿠(Fugaku)’보다 2배 이상 빠르게 만들 것이다. 후지쓰(Fujitsu)에서 만든 이 슈퍼컴퓨터의 연산 속도는 442페타플롭스에 달한다.  방대한 양의 데이터를 빠르게 처리할 수 있다는 점에서 슈퍼컴퓨터는 이미 의학 연구 및 약물 개발을 가속하는 데 쓰이고 있다. 이를테면 2020년 초 팬데믹이 시작된 이후 코로나19 연구에 박차를 가하기 위해 슈퍼컴퓨터가 사용되고 있다.   이 밖에 석유 및 가스...

테슬라 자율주행차 슈퍼컴퓨터 도조 D1 반도체 AI 인공지능 휴머노이드 로봇 로봇 후가쿠

2021.09.03

정확하다면, 플롭스(FLOPS)로 측정한 테슬라의 자체 개발 ‘도조(Dojo)’ 슈퍼컴퓨터의 성능은 전 세계에서 가장 빠른 슈퍼컴퓨터를 2배 이상 능가한다.  자율주행차는 실시간으로 도로 상황을 인식하고, 결정을 내리며, 적절한 조치를 취할 수 있는 능력을 갖춰야 한다. 이를 위해서는 초고속 처리 능력과 함께 자동차가 ‘학습’할 수 있도록 하는 온보드 인공지능이 필요하다.    테슬라는 지난 2019년 맞춤형 AI 칩을 공개했다. 그리고 곧 이 칩을 사용해 자동차를 제조하기 시작했다. 이제 테슬라는 도조 슈퍼컴퓨터의 성능을 극대화하기 위해 자체 개발한 AI 반도체(D1)를 선보였다.  회사에 따르면 D1은 362테라플롭스(Tflops)의 처리 능력을 갖추고 있다. 이는 초당 362조 번의 부동 소수점 연산(FLOPS)을 수행할 수 있다는 의미라고 테슬라는 말했다.  이제 D1 칩 25개를 하나의 학습용 타일(training tile)에 배치하고, 여러 서버를 통해 120개의 학습용 타일을 결합하는 걸 상상해보라. 이게 바로 테슬라가 자사의 자율주행차를 위해 도조 슈퍼컴퓨터로 하는 일이다. 그리고 9페타플롭스(Pflops)의 컴퓨팅 성능을 갖춘 각 학습용 타일에서 (필자의 부정확한 계산에 따르자면) 도조는 1.08엑사플롭스(Exaflops)의 성능을 구현한다(테슬라에서는 1.1엑사플롭스라고 말하고 있다).  이 정도의 성능은 도조를 현재 전 세계에서 가장 빠른 슈퍼컴퓨터인 ‘후가쿠(Fugaku)’보다 2배 이상 빠르게 만들 것이다. 후지쓰(Fujitsu)에서 만든 이 슈퍼컴퓨터의 연산 속도는 442페타플롭스에 달한다.  방대한 양의 데이터를 빠르게 처리할 수 있다는 점에서 슈퍼컴퓨터는 이미 의학 연구 및 약물 개발을 가속하는 데 쓰이고 있다. 이를테면 2020년 초 팬데믹이 시작된 이후 코로나19 연구에 박차를 가하기 위해 슈퍼컴퓨터가 사용되고 있다.   이 밖에 석유 및 가스...

2021.09.03

엔비디아, 공동 개발한 슈퍼컴퓨터 ‘캠브리지-1’ 정식 가동 발표

엔비디아가 제약사, 병원, 대학 등과 공동 개발한 보건의료용 슈퍼컴퓨팅 캠브리지-1’을 6일(현지시간) 정식 가동했다고 밝혔다. 업체는 슈퍼컴퓨터의 AI 및 시뮬레이션 역량을 통해 디지털 생물학, 유전체학, 양자컴퓨팅 분야의 협업 연구를 가속화하는 게 목표라고 설명했다.  엔비디아는 이날 아스트라제네카, 글락소스미스클라인, 옥스포드 나노포어 테크놀로지, 킹스 칼리지 런던 등 영국 소재 기업 및 대학과 함께 DGX 슈퍼POD(DGX SuperPOD) 슈퍼컴퓨팅 클러스터인 캠브리지-1을 기반으로 한 신약 개발, 질병 유발 변이 탐색, 질병 모델링 등의 연구를 수행할 것이라고 발표했다.    DGX 슈퍼POD 퍼컴퓨팅 클러스터인 캠브리지-1은 여러 개의 모듈이 함께 작동할 수 있도록 설계된 병렬처리형 슈퍼컴퓨터다. 80대의 엔비디아 DGX A100 시스템을 기반으로 하며, 400페타플롭스 이상의 AI 컴퓨팅 연산 능력을 갖추고 있다. 이는 현존 슈퍼컴퓨터 중 성능 1위로 알려진 일본의 ‘후가쿠’(fugaku ; 약 415 페타플롭스)에 비견되는 속도라는 설명이다.  엔비디아는 외부 업체들이 연구 목적으로 접근할 수 있도록 캠브리지-1이 설계돼 있다고 전했다. 덕분에 파트너 업체들이 캠브리지-1의 AI 연산 능력을 기반으로 의료 보건 연구를 가속화할 수 있을 것이라고 설명했다.  엔비디아에 따르면, 연구 파트너 중 한 곳인 아스트라제네카는 캠브리지-1을 이용해 조직 샘플의 슬라이드 이미지에 주석을 다는 데 드는 수고를 줄일 수 있게 될 전망이다.  또 회사는 DNA 염기서열 분석 스타트업인 옥스포드 나노포어 테크놀로지가 캠브리지-1을 이용해 자사의 게놈 분석용 AI 알고리즘을 수시간 내에 개선할 수 있게 될 것이라고 덧붙였다.  엔비디아 CEO인 젠슨 황은 “캠브리지-1을 통해 지금껏 영국에서는 구현하기 어려웠던 규모와 속도로 질병 치료의 실마리를 풀 수 있을 것”이라고 말했다. ciokr@i...

엔비디아 슈퍼컴퓨터 캠브리지-1

2021.07.07

엔비디아가 제약사, 병원, 대학 등과 공동 개발한 보건의료용 슈퍼컴퓨팅 캠브리지-1’을 6일(현지시간) 정식 가동했다고 밝혔다. 업체는 슈퍼컴퓨터의 AI 및 시뮬레이션 역량을 통해 디지털 생물학, 유전체학, 양자컴퓨팅 분야의 협업 연구를 가속화하는 게 목표라고 설명했다.  엔비디아는 이날 아스트라제네카, 글락소스미스클라인, 옥스포드 나노포어 테크놀로지, 킹스 칼리지 런던 등 영국 소재 기업 및 대학과 함께 DGX 슈퍼POD(DGX SuperPOD) 슈퍼컴퓨팅 클러스터인 캠브리지-1을 기반으로 한 신약 개발, 질병 유발 변이 탐색, 질병 모델링 등의 연구를 수행할 것이라고 발표했다.    DGX 슈퍼POD 퍼컴퓨팅 클러스터인 캠브리지-1은 여러 개의 모듈이 함께 작동할 수 있도록 설계된 병렬처리형 슈퍼컴퓨터다. 80대의 엔비디아 DGX A100 시스템을 기반으로 하며, 400페타플롭스 이상의 AI 컴퓨팅 연산 능력을 갖추고 있다. 이는 현존 슈퍼컴퓨터 중 성능 1위로 알려진 일본의 ‘후가쿠’(fugaku ; 약 415 페타플롭스)에 비견되는 속도라는 설명이다.  엔비디아는 외부 업체들이 연구 목적으로 접근할 수 있도록 캠브리지-1이 설계돼 있다고 전했다. 덕분에 파트너 업체들이 캠브리지-1의 AI 연산 능력을 기반으로 의료 보건 연구를 가속화할 수 있을 것이라고 설명했다.  엔비디아에 따르면, 연구 파트너 중 한 곳인 아스트라제네카는 캠브리지-1을 이용해 조직 샘플의 슬라이드 이미지에 주석을 다는 데 드는 수고를 줄일 수 있게 될 전망이다.  또 회사는 DNA 염기서열 분석 스타트업인 옥스포드 나노포어 테크놀로지가 캠브리지-1을 이용해 자사의 게놈 분석용 AI 알고리즘을 수시간 내에 개선할 수 있게 될 것이라고 덧붙였다.  엔비디아 CEO인 젠슨 황은 “캠브리지-1을 통해 지금껏 영국에서는 구현하기 어려웠던 규모와 속도로 질병 치료의 실마리를 풀 수 있을 것”이라고 말했다. ciokr@i...

2021.07.07

6월 슈퍼컴 톱500 살펴보니··· 인텔 하락세 지속, 차세대 '사파이어 래피드' 출시도 연기

6월 공개된 슈퍼 컴퓨터 톱500 목록에 따르면 후가쿠가 442Pflop/sec의 성능으로 1위를 차지했다. 2위 머신보다 3배나 빠르다. 충분히 인상적인 성능이지만 오히려 과소평가된 것일 수 있다. 벤치마크 기법에 따라 역사상 최초로 엑사 플롭 장벽을 허문 슈퍼컴퓨터일 수 있기 때문이다.  톱500 자료에 따르면 후가쿠의 점수는 배정밀도(double-precision) 벤치마크에 기반해 산출됐다. 그러나 AI 및 머신러닝 연산의 상당수는 단정밀도(single-precision)다. 즉 단정밀도 모드에서 실행될 경우 후가쿠의 최고 성능은 엑사 플롭 이상일 수 있다. 실제로 새로운 HPL-AI 벤치마크를 실행할 때 후가쿠의 클럭은 2Eflop/sec에 이른다. 물론 배정밀도 연산에서 엑사플롭스를 달성하기 전까지는 공식 기록으로 인정되지는 않을 것이다.  이 밖에 후가쿠의 클론이 등장할 것이 확실시된다. 후지쯔가 후가쿠용으로 디자인한 Arm 기반 A64FX 프로세서를 외부에 판매할 방침이기 때문이다. 실제로 HPE의 크레이 자회사가 이 칩에 기반한 서버를 판매할 예정이다. 이미 4개의 다른 A64FRX 시스템(14위, 25위, 63위, 288위)가 일본에서 동작 중인 가운데, HPE의 비즈니스 범위를 감안하면 더 많은 후가쿠와 유사한 아키텍처의 슈퍼컴퓨터가 등장할 것으로 예상할 수 있다.  AMD의 도약 한편 서버 및 슈퍼컴퓨터 분야에서 AMD의 약진이 계속되고 있다. 서버 분야 점유율 10%를 넘어섰으며, 현재 톱500 리스트의 10%가 AMD 프로세서에 기반하고 있다. 작년 11월에는 AMD 기반 시스템이 톱500 중 21개에 불과했지만, 올해 6월 목록에서는 그 숫자가 49개로 늘어났다.  인텔의 좌절 AMD의 상승은 인텔의 하락을 기반으로 이뤄진 것이다. 인텔 기반 슈퍼컴퓨터의 수는 작년 6월 470대에서 올해 431대로 감소했다. 그리고 인텔은 추세를 바로잡으려는 시도에 어려움을 겪고 있다. 회사는 코드명 ‘사파...

톱500 슈퍼컴퓨터 인텔 사파이어 래피드 에픽 Arm 후가쿠

2021.07.06

6월 공개된 슈퍼 컴퓨터 톱500 목록에 따르면 후가쿠가 442Pflop/sec의 성능으로 1위를 차지했다. 2위 머신보다 3배나 빠르다. 충분히 인상적인 성능이지만 오히려 과소평가된 것일 수 있다. 벤치마크 기법에 따라 역사상 최초로 엑사 플롭 장벽을 허문 슈퍼컴퓨터일 수 있기 때문이다.  톱500 자료에 따르면 후가쿠의 점수는 배정밀도(double-precision) 벤치마크에 기반해 산출됐다. 그러나 AI 및 머신러닝 연산의 상당수는 단정밀도(single-precision)다. 즉 단정밀도 모드에서 실행될 경우 후가쿠의 최고 성능은 엑사 플롭 이상일 수 있다. 실제로 새로운 HPL-AI 벤치마크를 실행할 때 후가쿠의 클럭은 2Eflop/sec에 이른다. 물론 배정밀도 연산에서 엑사플롭스를 달성하기 전까지는 공식 기록으로 인정되지는 않을 것이다.  이 밖에 후가쿠의 클론이 등장할 것이 확실시된다. 후지쯔가 후가쿠용으로 디자인한 Arm 기반 A64FX 프로세서를 외부에 판매할 방침이기 때문이다. 실제로 HPE의 크레이 자회사가 이 칩에 기반한 서버를 판매할 예정이다. 이미 4개의 다른 A64FRX 시스템(14위, 25위, 63위, 288위)가 일본에서 동작 중인 가운데, HPE의 비즈니스 범위를 감안하면 더 많은 후가쿠와 유사한 아키텍처의 슈퍼컴퓨터가 등장할 것으로 예상할 수 있다.  AMD의 도약 한편 서버 및 슈퍼컴퓨터 분야에서 AMD의 약진이 계속되고 있다. 서버 분야 점유율 10%를 넘어섰으며, 현재 톱500 리스트의 10%가 AMD 프로세서에 기반하고 있다. 작년 11월에는 AMD 기반 시스템이 톱500 중 21개에 불과했지만, 올해 6월 목록에서는 그 숫자가 49개로 늘어났다.  인텔의 좌절 AMD의 상승은 인텔의 하락을 기반으로 이뤄진 것이다. 인텔 기반 슈퍼컴퓨터의 수는 작년 6월 470대에서 올해 431대로 감소했다. 그리고 인텔은 추세를 바로잡으려는 시도에 어려움을 겪고 있다. 회사는 코드명 ‘사파...

2021.07.06

‘후가쿠 1위, 펄머터 5위’ 2021년 6월 슈퍼컴퓨터 톱 500 리스트

후가쿠가 3회 연속 슈퍼 컴퓨터 톱500 리스트에서 1위를 차지했다. 2위에 비해 여전히 3배나 빠르다.  6월 발표된 슈퍼 컴퓨터 순위 리스트 중 10위에 진입한 기기는 하나에 불과했다. 로렌스 버클리 국립 연구소에 있는 NERSC(National Energy Research Scientific Computing)의 펄뮤터가 5위에 등극했다. 담맘-7이라는 시스템이 10위에서 밀려났다.  톱500 리스트는 매년 6월과 11월 업데이트된다. 순위는 고밀도 선형 방정석을 얼마나 잘 해결하는지 측정하는 HPL(고성능 린팩) 벤치마크를 기반으로 매겨진다. 10위 이내의 기기는 다음과 같다.  1위 후가쿠 442Pflop/s의 이 시스템은 후지츠가 구축했으며, 7,630,848개의 코어를 내장했다. 일본 고베의 리켄 컴퓨터 과학 센터(R-CCS)에 있다.  2위 서밋 미국에서 가장 빠른 시스템인 서밋은 148.8Pflop/s의 속도를 기록했다. 노드가 4,356개 존재하며, 각 노드에는 22개의 코어가 있는 2개의 파워9 CPU와 6개의 엔비디아 테슬라 V100 GPU가 설치돼 있다. 노드는 멜라녹스 이중 레일 EDR 인피니밴드 네트워크로 연결된다. IBM이 구축한 이 시스템은 테네시의 오크 릿지 국립 연구소에 자리하고 있다. 3위 시에라 서밋과 매우 유사한 아키텍처의 시스템으로 속도는 94.6Pflop/s다. 2개의 파워9 CPU와 4개의 엔비디아 테슬라 V100 GPU를 내장한 4,320개의 노드로 구성돼 있다. 로렌스 리버모어 국립 연구소가 운영하고 있다. 4위 선웨이 타이후라이트 93Pflop/s의 이 중국 시스템은 10,649,600 코어의 선웨이 SW26010 프로세서로 구동된다. 중국의 NRCPC (National Research Center of Parallel Computer Engineering & Technology)에서 개발했으며, 중국 국립 슈퍼컴퓨팅 센터에 설치돼 있다. 5위 펄머터 10...

슈퍼컴퓨터 톱500 후가쿠 펄뮤터

2021.06.29

후가쿠가 3회 연속 슈퍼 컴퓨터 톱500 리스트에서 1위를 차지했다. 2위에 비해 여전히 3배나 빠르다.  6월 발표된 슈퍼 컴퓨터 순위 리스트 중 10위에 진입한 기기는 하나에 불과했다. 로렌스 버클리 국립 연구소에 있는 NERSC(National Energy Research Scientific Computing)의 펄뮤터가 5위에 등극했다. 담맘-7이라는 시스템이 10위에서 밀려났다.  톱500 리스트는 매년 6월과 11월 업데이트된다. 순위는 고밀도 선형 방정석을 얼마나 잘 해결하는지 측정하는 HPL(고성능 린팩) 벤치마크를 기반으로 매겨진다. 10위 이내의 기기는 다음과 같다.  1위 후가쿠 442Pflop/s의 이 시스템은 후지츠가 구축했으며, 7,630,848개의 코어를 내장했다. 일본 고베의 리켄 컴퓨터 과학 센터(R-CCS)에 있다.  2위 서밋 미국에서 가장 빠른 시스템인 서밋은 148.8Pflop/s의 속도를 기록했다. 노드가 4,356개 존재하며, 각 노드에는 22개의 코어가 있는 2개의 파워9 CPU와 6개의 엔비디아 테슬라 V100 GPU가 설치돼 있다. 노드는 멜라녹스 이중 레일 EDR 인피니밴드 네트워크로 연결된다. IBM이 구축한 이 시스템은 테네시의 오크 릿지 국립 연구소에 자리하고 있다. 3위 시에라 서밋과 매우 유사한 아키텍처의 시스템으로 속도는 94.6Pflop/s다. 2개의 파워9 CPU와 4개의 엔비디아 테슬라 V100 GPU를 내장한 4,320개의 노드로 구성돼 있다. 로렌스 리버모어 국립 연구소가 운영하고 있다. 4위 선웨이 타이후라이트 93Pflop/s의 이 중국 시스템은 10,649,600 코어의 선웨이 SW26010 프로세서로 구동된다. 중국의 NRCPC (National Research Center of Parallel Computer Engineering & Technology)에서 개발했으며, 중국 국립 슈퍼컴퓨팅 센터에 설치돼 있다. 5위 펄머터 10...

2021.06.29

메가플롭스에서 요타플롭스까지!··· 슈퍼컴퓨터 발전상 따라잡기

컴퓨팅에서는 언제나 속도가 가장 중요했다. 허먼 홀러리스는 1880년 미국 인구 조사 작업을 수행했다. 수기로 진행된 해당 작업은 고통스럽고 느리며 오류에 취약했다. 그래서 홀러리스는 1890년대의 인구 조사 결과를 계수하기 위해 ‘Hollerith 1890 Census Tabulator’ 펀치 카드 시스템을 개발했다.  그의 전기 기계 장치는 ‘불과’ 2년 만에 작업을 수행할 수 있었고 정부는 500만 달러를 절감했다. 그는 그 수익을 이용해 태블레이팅 머신 컴퍼니 (Tabulating Machine Company)라는 회사를 설립했다. 이 회사의 명칭은 IBM으로 더 잘 알려져 있다. 물론, 그의 기계가 진정한 컴퓨터는 아니었지만 이후의 모든 컴퓨터를 위한 패턴을 마련했다. 하지만 1964년에 세이모어 크레이가 CDC(Control Data Center) 6600을 설계하고 나서야 ‘슈퍼컴퓨터’라는 용어가 활용되기 시작했다. CDC: 슈퍼컴퓨팅의 시작 크레이는 ‘현존하는 그 어떤 것보다 수백 배 강력한’ 기계에 대한 수요가 항상 있을 것이라고 생각했다. 이것은 그의 꿈이었으며 그의 노력에 힘입어 슈퍼컴퓨터가 탄생했다. 여정은 쉽지 않았다. 크레이는 이미 괴팍한 천재로 유명했고 CDC를 떠나라는 위협을 받았다. 그는 결국 자신의 팀이 CDC 6600을 개발할 수 있도록 허락을 받은 후에야 머무르기로 합의했다.  40만 개의 트랜지스터와 100마일이 넘는 수작업 배선, 프레온 냉각을 통해 최소 40MHz의 속도 또는 초당 300만 회(메가플롭스(MegaFlops))의 부동 소수점 연산 속도를 달성할 수 있었다. 홀러리스는 주된 I/O 방법으로 펀치 카드를 이용했다. 이전의 가장 빠른 컴퓨터였던 IBM 7030 스트레치보다 훨씬 빨랐다. 오늘날 3메가플롭스는 고통스러울 정도로 느린 속도다. 라즈베리 파이(Raspberry Pi) 초기 모델조차도 42메가플롭스로 작동한다. 그러나 당시 CDC 6600은 가장 빨랐으며 크레이와 CDC가 ...

슈퍼컴퓨터 크레이 CDC 6600 IBM 인텔 엔비디아 AMD ARM 톱500

2020.12.14

컴퓨팅에서는 언제나 속도가 가장 중요했다. 허먼 홀러리스는 1880년 미국 인구 조사 작업을 수행했다. 수기로 진행된 해당 작업은 고통스럽고 느리며 오류에 취약했다. 그래서 홀러리스는 1890년대의 인구 조사 결과를 계수하기 위해 ‘Hollerith 1890 Census Tabulator’ 펀치 카드 시스템을 개발했다.  그의 전기 기계 장치는 ‘불과’ 2년 만에 작업을 수행할 수 있었고 정부는 500만 달러를 절감했다. 그는 그 수익을 이용해 태블레이팅 머신 컴퍼니 (Tabulating Machine Company)라는 회사를 설립했다. 이 회사의 명칭은 IBM으로 더 잘 알려져 있다. 물론, 그의 기계가 진정한 컴퓨터는 아니었지만 이후의 모든 컴퓨터를 위한 패턴을 마련했다. 하지만 1964년에 세이모어 크레이가 CDC(Control Data Center) 6600을 설계하고 나서야 ‘슈퍼컴퓨터’라는 용어가 활용되기 시작했다. CDC: 슈퍼컴퓨팅의 시작 크레이는 ‘현존하는 그 어떤 것보다 수백 배 강력한’ 기계에 대한 수요가 항상 있을 것이라고 생각했다. 이것은 그의 꿈이었으며 그의 노력에 힘입어 슈퍼컴퓨터가 탄생했다. 여정은 쉽지 않았다. 크레이는 이미 괴팍한 천재로 유명했고 CDC를 떠나라는 위협을 받았다. 그는 결국 자신의 팀이 CDC 6600을 개발할 수 있도록 허락을 받은 후에야 머무르기로 합의했다.  40만 개의 트랜지스터와 100마일이 넘는 수작업 배선, 프레온 냉각을 통해 최소 40MHz의 속도 또는 초당 300만 회(메가플롭스(MegaFlops))의 부동 소수점 연산 속도를 달성할 수 있었다. 홀러리스는 주된 I/O 방법으로 펀치 카드를 이용했다. 이전의 가장 빠른 컴퓨터였던 IBM 7030 스트레치보다 훨씬 빨랐다. 오늘날 3메가플롭스는 고통스러울 정도로 느린 속도다. 라즈베리 파이(Raspberry Pi) 초기 모델조차도 42메가플롭스로 작동한다. 그러나 당시 CDC 6600은 가장 빨랐으며 크레이와 CDC가 ...

2020.12.14

ARM-ETRI, 슈퍼컴퓨터 개발 협력 발표…“HPC 에코시스템 확장”

ARM가 ETRI(한국전자통신연구원)의 슈퍼컴퓨터 K-AB21(K-Artificial Brain 21)에 ARM 기술을 지원할 예정이라고 발표했다.  회사에 따르면 ETRI는 곧 출시될 ARM의 네오버스 V1을 첫 슈퍼컴퓨터인 K-AB21 시스템에 도입할 계획이다. 네오버스 V1은 ARM의 SVE(Scalable Vector Extensions)를 지원하는데, 이를 통해 ETRI은 AB21에서 CPU당 16테라플롭스, 랙당 1600테라플롭스를 달성하고 목표 대비 전력소모를 60% 감소를 실현할 계획이다. 이와 동시에 ARM은 HPC 에코시스템 전반에서 ARM 기반 솔루션 도입이 증가하고 있다고 밝혔다. ARM은 ‘슈퍼컴퓨팅 컨퍼런스(ISC High Performance, 이하 ISC)’의 톱 500 경연대회에서 2회 연속 세계 1위에 오른 슈퍼컴퓨터 후가쿠의 기술 기반을 제공한 바 있으며, 이외에도 다양한 기업에 ARM 기반 솔루션을 제공하면서 HPC 에코시스템을 지속적으로 확장하고 있다고 설명했다.  암페어 컴퓨팅, 샌디아 국립 연구소, 브리스톨 대학, AWS는 11월 초에 열린 AHUG(ARM High-Performance Computing User Group) 회의에서 각 사의 ARM 기반 HPC에 대한 자세한 계획을 공유했다. 11월 초에 진행된 SC20 행사에서는 유럽 프로세서 이니셔티브(European Processor Initiative)가 설립한 기업인 SiPearl도 자사의 엑사스케일 컴퓨팅 프로젝트의 일환인 레아(Rhea) 프로세서에 네오버스 V1을 도입할 예정이라고 강조했다. 또한, 엔비디아도 연구자들이 엔비디아의 A100 GPU와 ARM 네오버스 기반 암페어 알트라(Altra) CPU를 이용한 ARM의 HPC에서 26배에 달하는 성능 향상을 구현했다고 발표했다. ARM 기반 솔루션의 영향력이 가시화되기에는 아직 이르지만, 후가쿠가 코로나19 연구에 미친 긍정적인 영향력은 ARM의 성과 중 하나라고 업체 측은 밝...

ARM ETRI 슈퍼컴퓨터

2020.11.30

ARM가 ETRI(한국전자통신연구원)의 슈퍼컴퓨터 K-AB21(K-Artificial Brain 21)에 ARM 기술을 지원할 예정이라고 발표했다.  회사에 따르면 ETRI는 곧 출시될 ARM의 네오버스 V1을 첫 슈퍼컴퓨터인 K-AB21 시스템에 도입할 계획이다. 네오버스 V1은 ARM의 SVE(Scalable Vector Extensions)를 지원하는데, 이를 통해 ETRI은 AB21에서 CPU당 16테라플롭스, 랙당 1600테라플롭스를 달성하고 목표 대비 전력소모를 60% 감소를 실현할 계획이다. 이와 동시에 ARM은 HPC 에코시스템 전반에서 ARM 기반 솔루션 도입이 증가하고 있다고 밝혔다. ARM은 ‘슈퍼컴퓨팅 컨퍼런스(ISC High Performance, 이하 ISC)’의 톱 500 경연대회에서 2회 연속 세계 1위에 오른 슈퍼컴퓨터 후가쿠의 기술 기반을 제공한 바 있으며, 이외에도 다양한 기업에 ARM 기반 솔루션을 제공하면서 HPC 에코시스템을 지속적으로 확장하고 있다고 설명했다.  암페어 컴퓨팅, 샌디아 국립 연구소, 브리스톨 대학, AWS는 11월 초에 열린 AHUG(ARM High-Performance Computing User Group) 회의에서 각 사의 ARM 기반 HPC에 대한 자세한 계획을 공유했다. 11월 초에 진행된 SC20 행사에서는 유럽 프로세서 이니셔티브(European Processor Initiative)가 설립한 기업인 SiPearl도 자사의 엑사스케일 컴퓨팅 프로젝트의 일환인 레아(Rhea) 프로세서에 네오버스 V1을 도입할 예정이라고 강조했다. 또한, 엔비디아도 연구자들이 엔비디아의 A100 GPU와 ARM 네오버스 기반 암페어 알트라(Altra) CPU를 이용한 ARM의 HPC에서 26배에 달하는 성능 향상을 구현했다고 발표했다. ARM 기반 솔루션의 영향력이 가시화되기에는 아직 이르지만, 후가쿠가 코로나19 연구에 미친 긍정적인 영향력은 ARM의 성과 중 하나라고 업체 측은 밝...

2020.11.30

엔비디아-ARM, “슈퍼컴퓨팅 성능 26배 향상”

엔비디아와 ARM이 지난 18개월간 고성능컴퓨팅(HPC) 분야에서 ARM 기반 플랫폼의 성능을 25.5배 향상시켰다고 밝혔다. 회사에 따르면 ARM 네오버스 N1(Neoverse N1) 코어는 암페어 컴퓨팅(Ampere Computing)의 알트라(Altra)와 같은 시스템온칩(SoC)의 성능을 지난해 디자인 대비 약 2.3배 향상시켰다.  엔비디아의 A100 텐서 코어(Tensor Core) GPU는 단일 세대에서 최고 성능 향상을 달성했으며, 최신 ARM 기반 플랫폼은 코어, 입출력 레인과 메모리 속도를 개선시켰다고 업체 측은 설명했다.  그 결과, 2개의 암페어 컴퓨팅의 알트라 SoC와 2개의 A100 GPU로 구성된 엔비디아의 HPC용 ARM 기반 레퍼런스 디자인은 연구원들이 2019년 6월에 사용했던 듀얼-SoC 서버의 25.5배에 달하는 성능을 구현했다. 엔비디아와 ARM은 GPU로 가속화된 ARM 기반 레퍼런스 플랫폼에 한해서만 1년 만에 2.5배의 성능 개선을 달성했다. 이 같은 성과는 코로나19 팬데믹 상황에서 최우선 과제로 꼽히는 신약 개발의 핵심이 되는 그로맥스, 램스, MILC, NAMD, 퀀텀 에스프레소와 같은 주요 HPC 애플리케이션에도 해당된다. 이 외에도, ARM 기반 시스템 운영체제에서 실행될 수 있는 다양한 애플리케이션은 엔비디아의 GPU 가속 소프트웨어 허브인 NGC 컨테이너에서 이용할 수 있다. 분자역학, 양자화학 등의 분야에서 한계를 극복해 나가고 있는 기업과 연구원들은 이러한 애플리케이션들을 활용해 기초과학뿐 아니라 헬스케어 등과 같은 분야의 발전을 이끌 수 있다. 최신 레퍼런스 아키텍처는 2U 크기의 서버 플랫폼인 암페어 컴퓨팅의 마운틴 제이드의 에너지 효율적인 처리량과 이미 전 세계의 주요 슈퍼컴퓨터를 가속화하고 있는 엔비디아의 HGX A100가 결합된 것이다. 이 아키텍처는 마벨 썬더X2와 엔비디아 V100 GPU를 기반으로 지난해 첫 선을 보인 디자인의 후속작이다. 마운틴 제이드는...

엔비디아 ARM 슈퍼컴퓨터

2020.11.19

엔비디아와 ARM이 지난 18개월간 고성능컴퓨팅(HPC) 분야에서 ARM 기반 플랫폼의 성능을 25.5배 향상시켰다고 밝혔다. 회사에 따르면 ARM 네오버스 N1(Neoverse N1) 코어는 암페어 컴퓨팅(Ampere Computing)의 알트라(Altra)와 같은 시스템온칩(SoC)의 성능을 지난해 디자인 대비 약 2.3배 향상시켰다.  엔비디아의 A100 텐서 코어(Tensor Core) GPU는 단일 세대에서 최고 성능 향상을 달성했으며, 최신 ARM 기반 플랫폼은 코어, 입출력 레인과 메모리 속도를 개선시켰다고 업체 측은 설명했다.  그 결과, 2개의 암페어 컴퓨팅의 알트라 SoC와 2개의 A100 GPU로 구성된 엔비디아의 HPC용 ARM 기반 레퍼런스 디자인은 연구원들이 2019년 6월에 사용했던 듀얼-SoC 서버의 25.5배에 달하는 성능을 구현했다. 엔비디아와 ARM은 GPU로 가속화된 ARM 기반 레퍼런스 플랫폼에 한해서만 1년 만에 2.5배의 성능 개선을 달성했다. 이 같은 성과는 코로나19 팬데믹 상황에서 최우선 과제로 꼽히는 신약 개발의 핵심이 되는 그로맥스, 램스, MILC, NAMD, 퀀텀 에스프레소와 같은 주요 HPC 애플리케이션에도 해당된다. 이 외에도, ARM 기반 시스템 운영체제에서 실행될 수 있는 다양한 애플리케이션은 엔비디아의 GPU 가속 소프트웨어 허브인 NGC 컨테이너에서 이용할 수 있다. 분자역학, 양자화학 등의 분야에서 한계를 극복해 나가고 있는 기업과 연구원들은 이러한 애플리케이션들을 활용해 기초과학뿐 아니라 헬스케어 등과 같은 분야의 발전을 이끌 수 있다. 최신 레퍼런스 아키텍처는 2U 크기의 서버 플랫폼인 암페어 컴퓨팅의 마운틴 제이드의 에너지 효율적인 처리량과 이미 전 세계의 주요 슈퍼컴퓨터를 가속화하고 있는 엔비디아의 HGX A100가 결합된 것이다. 이 아키텍처는 마벨 썬더X2와 엔비디아 V100 GPU를 기반으로 지난해 첫 선을 보인 디자인의 후속작이다. 마운틴 제이드는...

2020.11.19

마이크로소프트 애저, 엔비디아 A100 GPU 탑재된 인스턴스 공개

마이크로소프트 애저가 엔비디아 A100 GPU를 탑재한 첫 인스턴스를 공개했다고 엔비디아는 밝혔다. 마이크로소프트는 연례 개발자 행사인 ‘빌드 2020(Build 2020)’에서 대규모 AI(AI at Scale)에 대한 비전을 소개했다. 해당 이니셔티브는 최첨단 AI 슈퍼컴퓨팅과 차세대 AI를 가능케 하는 새로운 종류의 대규모 AI 모델을 골자로 한다. 회사에 따르면 대규모 모델의 장점은 AI 슈퍼컴퓨팅을 이용해 방대한 양의 데이터를 한 번만 훈련하면 훨씬 작은 데이터셋과 리소스를 가진 다양한 작업 및 도메인을 정밀 조정할 수 있다는 점이다.  모델이 더 많은 파라미터를 가질수록 데이터의 어려운 뉘앙스를 잘 파악할 수 있다고 회사 측은 설명했다. 이는 170억 개의 파라미터를 가진 마이크로소프트의 언어 모델로, 처음 본 질문에 답하거나 문서를 요약할 수 있을 정도의 언어 이해력을 가진 Turing-NLG에 의해 입증됐다. 이 같은 자연어 모델들은 1년 전의 최신 모델보다 그 규모가 훨씬 크며, 과거의 이미지 중심 모델보다 수십 배 큰 규모로 빙, 워드, 아웃룩, 다이나믹스(Dynamics)에서 다양한 작업을 수행하고 있다. 이러한 규모의 훈련 모델은 머신 내부와 전체에 걸쳐 고대역폭 네트워크로 상호 연결된 전문 AI 가속기가 갖춰진 수백 대의 머신으로 구성된 대규모 클러스터를 필요로 한다. 마이크로소프트는 제품 전반에 걸쳐 새로운 자연어 생성 능력과 이해력을 구현하고, 안전한 AI를 개발한다는 오픈AI(OpenAI)의 미션을 지원하기 위해 이러한 클러스터를 애저에 구축했다. 마이크로소프트의 최신 클러스터는 AI 슈퍼컴퓨터라고 불릴 만큼 많은 통합된 컴퓨팅 성능을 제공한다. 또한, 오픈AI를 위해 구축된 클러스터는 현재까지 공개된 전세계 상위 5대 슈퍼컴퓨터 성능에 도달했다. 지난 5월, 오픈AI는 해당 슈퍼컴퓨터를 사용해 1,750억 개의 파라미터를 가진 GP5-3 모델과 함께, 이 모델이 시를 쓰거나 번역을 하는 등 특별히 훈련되...

마이크로소프트 엔비디아 애저 클라우드 슈퍼컴퓨터

2020.08.24

마이크로소프트 애저가 엔비디아 A100 GPU를 탑재한 첫 인스턴스를 공개했다고 엔비디아는 밝혔다. 마이크로소프트는 연례 개발자 행사인 ‘빌드 2020(Build 2020)’에서 대규모 AI(AI at Scale)에 대한 비전을 소개했다. 해당 이니셔티브는 최첨단 AI 슈퍼컴퓨팅과 차세대 AI를 가능케 하는 새로운 종류의 대규모 AI 모델을 골자로 한다. 회사에 따르면 대규모 모델의 장점은 AI 슈퍼컴퓨팅을 이용해 방대한 양의 데이터를 한 번만 훈련하면 훨씬 작은 데이터셋과 리소스를 가진 다양한 작업 및 도메인을 정밀 조정할 수 있다는 점이다.  모델이 더 많은 파라미터를 가질수록 데이터의 어려운 뉘앙스를 잘 파악할 수 있다고 회사 측은 설명했다. 이는 170억 개의 파라미터를 가진 마이크로소프트의 언어 모델로, 처음 본 질문에 답하거나 문서를 요약할 수 있을 정도의 언어 이해력을 가진 Turing-NLG에 의해 입증됐다. 이 같은 자연어 모델들은 1년 전의 최신 모델보다 그 규모가 훨씬 크며, 과거의 이미지 중심 모델보다 수십 배 큰 규모로 빙, 워드, 아웃룩, 다이나믹스(Dynamics)에서 다양한 작업을 수행하고 있다. 이러한 규모의 훈련 모델은 머신 내부와 전체에 걸쳐 고대역폭 네트워크로 상호 연결된 전문 AI 가속기가 갖춰진 수백 대의 머신으로 구성된 대규모 클러스터를 필요로 한다. 마이크로소프트는 제품 전반에 걸쳐 새로운 자연어 생성 능력과 이해력을 구현하고, 안전한 AI를 개발한다는 오픈AI(OpenAI)의 미션을 지원하기 위해 이러한 클러스터를 애저에 구축했다. 마이크로소프트의 최신 클러스터는 AI 슈퍼컴퓨터라고 불릴 만큼 많은 통합된 컴퓨팅 성능을 제공한다. 또한, 오픈AI를 위해 구축된 클러스터는 현재까지 공개된 전세계 상위 5대 슈퍼컴퓨터 성능에 도달했다. 지난 5월, 오픈AI는 해당 슈퍼컴퓨터를 사용해 1,750억 개의 파라미터를 가진 GP5-3 모델과 함께, 이 모델이 시를 쓰거나 번역을 하는 등 특별히 훈련되...

2020.08.24

'ARM 슈퍼컴이 1위, 역대 처음'··· 日 후카쿠, 슈퍼컴 순위 수위 등극

전 세계에서 가장 빠른 슈퍼컴퓨터에 일본의 후가쿠(Fugaku)가 이름을 올렸다. 전 세계 슈퍼컴퓨터의 성능을 기준으로 1위부터 500위까지 순위를 기록하는 톱500(TOP500)이 슈퍼컴 목록 55번째 버전을 발표했다. 이번에 1위에 오른 후카쿠는 기존 1위였던 서밋(Summit) 보다 약 2.8배 성능이 향상됐다. 일본 고베의 리켄 전산과학센터(R-CCS;RIKEN Center for Computational Science)에 구축된 후가쿠는, 린팩(LINPACK) 벤치마크로 측정한 초당 최대처리 속도(Rmax)가 415.5페타플롭(PFlop)이다. 이론상 낼 수 있는 최대 동작 속도(Rpeak)는 513.8페타플롭이다. 일본 고베의 리켄 전산과학센터(R-CCS;RIKEN Center for Computational Science)에 구축된 후가쿠, 415.53플롭의 린팩(LINPACK) 성능을 기록했다. (사진 : 후지쯔) 후가쿠는 48개의 코어를 가진 시스템 온 칩(SoC)인 후지쯔의 ARM 기반 A64FX 프로세서로 동작한다. 전체 시스템은 729만 9,072개의 코어로 구성되어 있으며, CPU의 동작 속도는 2.2GHz다. 인공지능이나 머신러닝에서 자주 사용되는 단일 정밀도 연산에서는 최대 1엑사플롭(1,000페타플롭)의 연산이 가능한 것으로 알려졌다. 후가쿠가 1위로 등극하면서 이제까지 1위를 고수했던 IBM의 서밋(Summit)는 자연스럽게 2위로 밀려났다. 서밋은   하나의 노드에 22개의 코어를 가진 파워9(Power9) CPU 2개와 6개의 엔비디아 테슬라 V100 GPU가 탑재된 4,356개의 노드로 구성되어 있다. 이를 통해 148.6페타플롭의 연산 속도를 제공한다. 3위는 94.6페타플롭의 처리 속도를 제공하는 미국 로렌스 리버모어 국립연구소에 있는 시에라(Sierra), 4위는 93페타플롭의 썬웨이 타이후라이트(Sunway TaihuLight)로 중국 NRCPC (National Research Center of ...

톱500 슈퍼컴퓨터 후카쿠 ARM IBM 서밋

2020.06.25

전 세계에서 가장 빠른 슈퍼컴퓨터에 일본의 후가쿠(Fugaku)가 이름을 올렸다. 전 세계 슈퍼컴퓨터의 성능을 기준으로 1위부터 500위까지 순위를 기록하는 톱500(TOP500)이 슈퍼컴 목록 55번째 버전을 발표했다. 이번에 1위에 오른 후카쿠는 기존 1위였던 서밋(Summit) 보다 약 2.8배 성능이 향상됐다. 일본 고베의 리켄 전산과학센터(R-CCS;RIKEN Center for Computational Science)에 구축된 후가쿠는, 린팩(LINPACK) 벤치마크로 측정한 초당 최대처리 속도(Rmax)가 415.5페타플롭(PFlop)이다. 이론상 낼 수 있는 최대 동작 속도(Rpeak)는 513.8페타플롭이다. 일본 고베의 리켄 전산과학센터(R-CCS;RIKEN Center for Computational Science)에 구축된 후가쿠, 415.53플롭의 린팩(LINPACK) 성능을 기록했다. (사진 : 후지쯔) 후가쿠는 48개의 코어를 가진 시스템 온 칩(SoC)인 후지쯔의 ARM 기반 A64FX 프로세서로 동작한다. 전체 시스템은 729만 9,072개의 코어로 구성되어 있으며, CPU의 동작 속도는 2.2GHz다. 인공지능이나 머신러닝에서 자주 사용되는 단일 정밀도 연산에서는 최대 1엑사플롭(1,000페타플롭)의 연산이 가능한 것으로 알려졌다. 후가쿠가 1위로 등극하면서 이제까지 1위를 고수했던 IBM의 서밋(Summit)는 자연스럽게 2위로 밀려났다. 서밋은   하나의 노드에 22개의 코어를 가진 파워9(Power9) CPU 2개와 6개의 엔비디아 테슬라 V100 GPU가 탑재된 4,356개의 노드로 구성되어 있다. 이를 통해 148.6페타플롭의 연산 속도를 제공한다. 3위는 94.6페타플롭의 처리 속도를 제공하는 미국 로렌스 리버모어 국립연구소에 있는 시에라(Sierra), 4위는 93페타플롭의 썬웨이 타이후라이트(Sunway TaihuLight)로 중국 NRCPC (National Research Center of ...

2020.06.25

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.9