2018.10.23

튜링 GPU는 어떻게 몰입형 AI를 혁신하는가

James Kobielu | InfoWorld

이제 GPU(Graphic Processing Unit)는 단순한 그래픽 칩에 그치지 않는다. 인공지능 혁명의 핵심으로 자리매김했다. 고충실도 3D 이미지 처리를 위한 연산 성능 덕분에 정교한 AI 애플리케이션을 작동시키는 신경망을 뒷받침하는 엔진으로 이어졌기 때문이다.

그렇다고 GPU가 처음부터 AI를 위해 개발된 것은 아니다. 엔비디아, AMD, 기타 칩 제조사들은 수 년 동안 PC그래픽, 상호형 게임, 이미지 후처리, 가상 데스크톱 인프라를 위한 GPU를 제공하면서 많은 수익을 얻었다.

그럼에도 불구하고 그래픽 처리와 AI 사이의 관련성은 부정할 수 없다. CNN(Convolutional Neural Network) 같은 경우 AI의 최전방에 서 있으며 주로 이미지 분석, 분류, 렌더링, 조작에 활용된다. GPU는 많은 애플리케이션에서 CNN 처리를 위한 주된 하드웨어 장치라고 할 수 있다.



AI와 이미지 처리의 공통점
기술적인 관점에서 이미지 처리와 AI의 공통점은 병렬적인 행렬벡터 연산에 의존한다는 것이며 여기에서 GPU가 빛을 발한다. 기본적으로 AI 기술의 매트릭스(일명 ‘텐서’(Tensor) 그래프)는 컴퓨터 생성 이미지 프레임의 픽셀 매트릭스 또는 점들의 열과 행과 같다.

GPU에 내장된 메모리 구조는 그래픽 이미지 전체를 하나의 행렬로 처리하며, 이는 딥러닝과 기타 AI행렬의 동시 실행을 통해 얻은 적응형 지능을 통해 농축된다. 이 아키텍처를 통해 GPU구동 시스템은 인라인AI를 활용하여 이미지 업데이트 및 수정 처리를 동적으로 그리고 선택적으로 가속화한다.

또한 애플리케이션 수준에서는 이런 작업 부하들 사이의 공생 관계가 명확하며, 이것이 GPU가 여러 그래픽이 풍부한 지능형 애플리케이션에서 선호되는 하드웨어 가속기 기술인 경우가 많은 이유이다.

AI가 점차 이미지를 자동으로 안정화하고 색상 및 노출을 조정하며 초점을 선택하고 현장에서 촬영하는 장면에 따라 실시간으로 이미지를 조정하여 기술이 서투른 사진을 촬영할 가능성을 줄여주는 스마트 카메라 등의 대중 시장 이미지 처리 제품에 내장되고 있다.

마찬가지로 노이즈 제거, 해상도 확장, VRS(Variable Rate Shading), 객체 감지, 가장자리 감지, 동작 감지, 누락된 엘리먼트 보간 등의 정교한 이미지 처리 기능이 스마트 카메라에 적용되면서 GPU 구동 AI 도입이 증가하고 있다.

실제로 브라우저 기반 머신러닝(ML) 도입 증가는 대부분 이미지 감지, 인식, 분류, 조작 등 GPU로 강화된 그래픽 집약적인 애플리케이션에 집중되어 있다. 그리고 GPU는 그래픽 애플리케이션에 게임, 예술, 엔터테인먼트, 의료, 기타 애플리케이션을 위한 사진과 동일한 고화질 이미지를 생성하는 것이 포함된 첨단 AI 접근방식인 GAN(Generative Adversarial Network)을 뒷받침하고 있다.

심지어 새로운 세대의 GPU 구동 스마트폰은 사람의 얼굴 이미지에 실제처럼 보이는 개선(실제로는 보정)을 적용하기 위해 개발된 동적 이미지 조작을 적용한다.

대부분의 배치에서 GPU와 CPU는 공생 관계가 있지만 GPU가 빛나는 영역은 명확하다. CPU코어와 비교하여 스트림 멀티프로세서(Stream Multiprocessor)라는 GPU의 실행 장치는 병렬로 더 많은 연산을 수행할 수 있다. GPU는 고속 벡터화와 행렬 조작을 위해 로컬 메모리와 레지스터에 더 많은 재사용 가능한 캐시 데이터를 저장할 수 있다. 또한 GPU는 CPU보다 메모리 대역폭이 더 높고 쓰레드 병렬화가 더 크며 짧은 경로 레지스터 메모리에 더 많은 데이터를 보관할 수 있다.

어떻게 엔비디아의 튜링 아키텍처를 통해 AI를 이용한 몰입형 경험이 가능한가?
엔비디아는 최근 튜링 아키텍처를 발표하면서 3D 이미지 처리와 인공 신경망을 통합하는 애플리케이션에서 가지는 GPU의 장기적인 이점을 강조했다. 튜링은 엔비디아의 8세대 GPU 아키텍처로 엔비디아 쿼드로(Quadro) RTX 8000, 쿼드로 RTX 6000, 쿼드로 RTX 5000 등 여러 신형 GPU에 통합됐다.

엔비디아의 종전 GPU 버전에 필수적이었던 그래픽 최적화 쿠다(CUDA) 코어와 AI 강화 텐서 코어의 개선 외에 엔비디아는 실시간 시나리오에서 엔비디아의 GPU가 광선 추적 연산을 더욱 빠르고 효율적으로 수행할 수 있도록 개발된 RT 코어라는 튜링에 새로운 그래픽 최적화 기술을 통합했다.

튜링은 고성능 컴퓨터 생성 이미지 애플리케이션에서만 사용할 수 있었던 광선 추적이 광선 전달의 물리학을 모델화한다. 엔비디아가 주로 "사실같은 게임"을 위한 튜링의 실시간 광선 추적을 홍보하고 있지만(그리고 이것이 마이크로소프트가 이 기술에 투자하는 이유를 이해하는데 도움이 되지만) 이 기능은 분명 몰입형 경험을 제공하기 위해 현실적인 시각 처리에 의존하는 실사화 애플리케이션에 적합하다.

그 기능은 광선이 주변 환경 안에서 물체에 의해 반사, 회절, 분산, 차단되는 방식을 모델화하는 것이다. 동적 광선 추적 장면은 전통적인 래스터(Raster)화 컴퓨터 시각화보다 훨씬 현실적으로 보일 수 있다. 실시간 광선 추적은 변화하는 반짝거림, 그림자, 색 변화 패턴과 기타 광선 확산 효과를 높은 충실도로 시뮬레이션할 수 있다.

연산 집약적인 실시간 광선 추적은 사용자가 원활한 가상 세계와 물리 세계의 융합을 기대하는 게임, 협업, 기타 몰입형 애플리케이션에서 차이를 보일 수 있다. 그 결과 엔비디아의 튜링 GPU는 사용자를 완전한 인공 디지털 환경에 몰입시키거나 실사 환경 위에 가상의 객체를 덧씌우거나 가상의 객체를 현실에 고정시키고 사용자가 가상의 객체와 상호작용할 수 있도록 하는 AI 강화 그래픽 애플리케이션에 초점을 맞추고 있다.

즉, GPU는 엔비디아의 튜링 아키텍처를 통해 알 수 있듯이 가상, 증강, 혼합현실 장치와 애플리케이션의 필수 구성 요소이다. 그래서 엔비디아가 튜링을 출시할 때 하나의 고대역폭 USB-C 케이블을 중심으로 가상 현실 연결을 표준화하는 새로운 USB-C 대안 모드인 버추얼링크에 대한 기본 지원을 포함시켰을 때에도 당연하게 느껴졌다. 그리고 인텔이 2년 후에 자체 GPU를 출시할 계획인 것도 당연해 보인다.




2018.10.23

튜링 GPU는 어떻게 몰입형 AI를 혁신하는가

James Kobielu | InfoWorld

이제 GPU(Graphic Processing Unit)는 단순한 그래픽 칩에 그치지 않는다. 인공지능 혁명의 핵심으로 자리매김했다. 고충실도 3D 이미지 처리를 위한 연산 성능 덕분에 정교한 AI 애플리케이션을 작동시키는 신경망을 뒷받침하는 엔진으로 이어졌기 때문이다.

그렇다고 GPU가 처음부터 AI를 위해 개발된 것은 아니다. 엔비디아, AMD, 기타 칩 제조사들은 수 년 동안 PC그래픽, 상호형 게임, 이미지 후처리, 가상 데스크톱 인프라를 위한 GPU를 제공하면서 많은 수익을 얻었다.

그럼에도 불구하고 그래픽 처리와 AI 사이의 관련성은 부정할 수 없다. CNN(Convolutional Neural Network) 같은 경우 AI의 최전방에 서 있으며 주로 이미지 분석, 분류, 렌더링, 조작에 활용된다. GPU는 많은 애플리케이션에서 CNN 처리를 위한 주된 하드웨어 장치라고 할 수 있다.



AI와 이미지 처리의 공통점
기술적인 관점에서 이미지 처리와 AI의 공통점은 병렬적인 행렬벡터 연산에 의존한다는 것이며 여기에서 GPU가 빛을 발한다. 기본적으로 AI 기술의 매트릭스(일명 ‘텐서’(Tensor) 그래프)는 컴퓨터 생성 이미지 프레임의 픽셀 매트릭스 또는 점들의 열과 행과 같다.

GPU에 내장된 메모리 구조는 그래픽 이미지 전체를 하나의 행렬로 처리하며, 이는 딥러닝과 기타 AI행렬의 동시 실행을 통해 얻은 적응형 지능을 통해 농축된다. 이 아키텍처를 통해 GPU구동 시스템은 인라인AI를 활용하여 이미지 업데이트 및 수정 처리를 동적으로 그리고 선택적으로 가속화한다.

또한 애플리케이션 수준에서는 이런 작업 부하들 사이의 공생 관계가 명확하며, 이것이 GPU가 여러 그래픽이 풍부한 지능형 애플리케이션에서 선호되는 하드웨어 가속기 기술인 경우가 많은 이유이다.

AI가 점차 이미지를 자동으로 안정화하고 색상 및 노출을 조정하며 초점을 선택하고 현장에서 촬영하는 장면에 따라 실시간으로 이미지를 조정하여 기술이 서투른 사진을 촬영할 가능성을 줄여주는 스마트 카메라 등의 대중 시장 이미지 처리 제품에 내장되고 있다.

마찬가지로 노이즈 제거, 해상도 확장, VRS(Variable Rate Shading), 객체 감지, 가장자리 감지, 동작 감지, 누락된 엘리먼트 보간 등의 정교한 이미지 처리 기능이 스마트 카메라에 적용되면서 GPU 구동 AI 도입이 증가하고 있다.

실제로 브라우저 기반 머신러닝(ML) 도입 증가는 대부분 이미지 감지, 인식, 분류, 조작 등 GPU로 강화된 그래픽 집약적인 애플리케이션에 집중되어 있다. 그리고 GPU는 그래픽 애플리케이션에 게임, 예술, 엔터테인먼트, 의료, 기타 애플리케이션을 위한 사진과 동일한 고화질 이미지를 생성하는 것이 포함된 첨단 AI 접근방식인 GAN(Generative Adversarial Network)을 뒷받침하고 있다.

심지어 새로운 세대의 GPU 구동 스마트폰은 사람의 얼굴 이미지에 실제처럼 보이는 개선(실제로는 보정)을 적용하기 위해 개발된 동적 이미지 조작을 적용한다.

대부분의 배치에서 GPU와 CPU는 공생 관계가 있지만 GPU가 빛나는 영역은 명확하다. CPU코어와 비교하여 스트림 멀티프로세서(Stream Multiprocessor)라는 GPU의 실행 장치는 병렬로 더 많은 연산을 수행할 수 있다. GPU는 고속 벡터화와 행렬 조작을 위해 로컬 메모리와 레지스터에 더 많은 재사용 가능한 캐시 데이터를 저장할 수 있다. 또한 GPU는 CPU보다 메모리 대역폭이 더 높고 쓰레드 병렬화가 더 크며 짧은 경로 레지스터 메모리에 더 많은 데이터를 보관할 수 있다.

어떻게 엔비디아의 튜링 아키텍처를 통해 AI를 이용한 몰입형 경험이 가능한가?
엔비디아는 최근 튜링 아키텍처를 발표하면서 3D 이미지 처리와 인공 신경망을 통합하는 애플리케이션에서 가지는 GPU의 장기적인 이점을 강조했다. 튜링은 엔비디아의 8세대 GPU 아키텍처로 엔비디아 쿼드로(Quadro) RTX 8000, 쿼드로 RTX 6000, 쿼드로 RTX 5000 등 여러 신형 GPU에 통합됐다.

엔비디아의 종전 GPU 버전에 필수적이었던 그래픽 최적화 쿠다(CUDA) 코어와 AI 강화 텐서 코어의 개선 외에 엔비디아는 실시간 시나리오에서 엔비디아의 GPU가 광선 추적 연산을 더욱 빠르고 효율적으로 수행할 수 있도록 개발된 RT 코어라는 튜링에 새로운 그래픽 최적화 기술을 통합했다.

튜링은 고성능 컴퓨터 생성 이미지 애플리케이션에서만 사용할 수 있었던 광선 추적이 광선 전달의 물리학을 모델화한다. 엔비디아가 주로 "사실같은 게임"을 위한 튜링의 실시간 광선 추적을 홍보하고 있지만(그리고 이것이 마이크로소프트가 이 기술에 투자하는 이유를 이해하는데 도움이 되지만) 이 기능은 분명 몰입형 경험을 제공하기 위해 현실적인 시각 처리에 의존하는 실사화 애플리케이션에 적합하다.

그 기능은 광선이 주변 환경 안에서 물체에 의해 반사, 회절, 분산, 차단되는 방식을 모델화하는 것이다. 동적 광선 추적 장면은 전통적인 래스터(Raster)화 컴퓨터 시각화보다 훨씬 현실적으로 보일 수 있다. 실시간 광선 추적은 변화하는 반짝거림, 그림자, 색 변화 패턴과 기타 광선 확산 효과를 높은 충실도로 시뮬레이션할 수 있다.

연산 집약적인 실시간 광선 추적은 사용자가 원활한 가상 세계와 물리 세계의 융합을 기대하는 게임, 협업, 기타 몰입형 애플리케이션에서 차이를 보일 수 있다. 그 결과 엔비디아의 튜링 GPU는 사용자를 완전한 인공 디지털 환경에 몰입시키거나 실사 환경 위에 가상의 객체를 덧씌우거나 가상의 객체를 현실에 고정시키고 사용자가 가상의 객체와 상호작용할 수 있도록 하는 AI 강화 그래픽 애플리케이션에 초점을 맞추고 있다.

즉, GPU는 엔비디아의 튜링 아키텍처를 통해 알 수 있듯이 가상, 증강, 혼합현실 장치와 애플리케이션의 필수 구성 요소이다. 그래서 엔비디아가 튜링을 출시할 때 하나의 고대역폭 USB-C 케이블을 중심으로 가상 현실 연결을 표준화하는 새로운 USB-C 대안 모드인 버추얼링크에 대한 기본 지원을 포함시켰을 때에도 당연하게 느껴졌다. 그리고 인텔이 2년 후에 자체 GPU를 출시할 계획인 것도 당연해 보인다.


X