2020.10.29

"맥북보다, 라이젠보다, 인텔보다 빠른 아이폰?" 크로스플랫폼 벤치마크의 허와 실

Gordon Mah Ung | PCWorld
“인텔 기반 맥북보다 빠른 아이폰 12”
“최신 아이폰, 가장 빠른 윈도우 울트라북보다 빨라”
“ARM 기반 맥북, x86 맥북보다 2배 빨라”


애플이 신형 아이폰을 발표했으므로, 11월 중순쯤에는 최초로 인텔이 아닌 자체 설계 ARM 기반 프로세서 기반의 맥북을 출시할 것이 분명해 보인다. 곧 위와 같은 낚시성 기사 제목을 볼 수 있을지도 모른다.
 
스마트폰과 노트북 성능도 중요하지만, 맥락도 중요하다. 그렇기 때문에 UL 퓨처마크의 새로운 3D 마크 와일드 라이프 벤치마크(3DMark Wild Life Benchmark)의 작동 방식을 이해하는 것이 중요하다. 크로스 플랫폼 테스트로 알려진 와일드 라이프는 안드로이드와 iOS, 윈도우에서 실행할 수 있다. 지금 무료로 스마트폰이나 태블릿에서 실행할 수 있다. 어드반스드 에디션을 보유한 윈도우 사용자는 UL, 스팀 또는 그린 맨 게이밍 스토어에서 무료 업데이트를 받을 수 있다. 

특히 높이 살 만한 점은 UL이 3D 마크 와일드 라이프 작업에 매우 개방적이며, 테스트와 실행 방법의 세부정보를 제공한다는 점이다. UL은 윈도우에서 ‘경량 노트북과 태블릿’을 대상으로 한 그래픽 테스트이며, 벌컨(Vulkan) API를 사용한다. 안드로이드 버전은 벌컨 API에서도 실행되며, iOS 버전은 애플의 메탈 API를 사용한다. 
 
ⓒ UL
 
테스트에는 게임을 내부적으로 2560ⅹ1440 렌더링한 다음, 디스플레이 해상도로 확장하는 표준 모드가 있다. 전체 디바이스를 볼 때, UL은 표준 실행을 권장한다. 

실제 그래픽 칩 비교를 위해, UL은 언리미티드(Unlimited) 모드 사용을 권장한다. 이 모드는 정확한 프레임 수를 렌더링하므로 디스플레이 크기 조정과 수직 동기화, 운영체제가 점수에 영향을 미치지 않는다. 

상기 링크에서 UL이 제공하는 자료에 따르면, 와일드 라이프 그래픽 테스트는 지오메트리와 조명, 후처리 효과의 양을 여러 번 조정해 구성한 많은 장면으로 진행된다. 테스트의 중추는 클러스터된 조명 컬링을 사용하는 지연된 렌더러다. 후처리 효과에는 블룸(bloom)과 열 왜곡, 볼륨 조명, 피사계 심도가 포함된다.

UL의 자료에는 더 많은 내용이 있지만, 궁금한 것은 윈도우 노트북과 아이폰 모두에서 실행되는 와일드 라이프 언리미티드의 결과다. A14 바이오닉을 탑재한 최신 아이폰 12에 대한 결과는 없지만, MacWorld.com에서 받은 비슷한 사양의 제품에 대한 결과는 있다. 아이폰 11 프로 맥스가 인텔 UHD620 그래픽과 인텔 아이리스 플러스 그래픽을 능가한다고 한다. 나아가 AMD 라이젠 7 4800U에 탑재된 라데온 그래픽까지도 능가한다는 결과가 인상적이다. 
 
벤치마크로도 거짓말을 할 수 있다. ⓒ IDG

위의 벤치마크 차트를 보면, ‘아이폰 11 프로 맥스는 심지어 라이젠보다 빠르다!”고 판단하고 인터넷에 게시글을 올리기에 충분해 보인다.

그렇다면 A13 바이오닉을 탑재한 아이폰 11 프로 맥스가 벤치마크에서 이들 PC를 앞서는 이유는 무엇일까? 솔직히, 인텔의 구형 UHD 그래픽이 그렇게 쉽게 내쳐지는 것을 봐도 놀랍지 않다. 이 제품이 환영 받지 못한 지도 이미 오래다. 애플이 인텔과 헤어진 이유로 UHD만을 언급했다면, 이를 납득하고 이 결별에 대해 푸념하면서 애플을 위로했을 것이다. 

그런데 왜 인텔 아이리스 플러스 그리고 AMD 라데온과 비교를 했을까? 무엇보다 아이폰과 비교한 이유가 무엇일까?

이유는 많다. 첫 번째는 3D마크 와일드 라이프가 벌컨 API에서 실행된다는 것이다. PC의 경우, 대부분의 게임은 여전히 마이크로소프트의 다이렉트엑스를 기반으로 한다. 다이렉트엑스를 기반으로 수익을 창출하기 때문에, 대부분의 드라이버 최적화가 여기에 포함된다. 

두 번째 이유는 애플이 절대반지를 만드는 사우론처럼 ARM 기반 A 시리즈 칩에 막대한 자원과 기술을 쏟아 부었기 때문이다. 속도는 의심할 여지가 없고, 윈도우에서의 벌컨과 달리, 애플의 메탈(Metal) 성능은 틀림없이 최우선순위에 있다. 게임 콘솔과 마찬가지로, API와 하드웨어 제작 역량을 둘 다 가질 경우 얻을 수 있는 효과다.

물론, 벤치마크 결과를 책임감 있게 표현하려면 “PC보다 빠른 아이폰!” 같은 낚시성 기사 제목보다 더 많은 맥락을 포함해야 한다. PCWorld는 인텔의 새로운 11 세대 타이거 레이크 코어(Tiger Lake Core) i7-1165G7을 탑재한 에이수스 젠북 플립(Asus ZenBook Flip) 프로덕션 버전을 테스트할 수 있었다. 
 
ⓒ IDG

당연히 맨 위에 있는 파란색 선은 인텔의 타이거 레이크 칩과 아이리스 Xe다. 여기 사용된 얇은 경량 젠북 플립의 코어 i7-1167G7 역시 가장 빠른 칩은 아니다. 다만 기사 제목이 한순간에 ‘라이젠과 아이스레이크보다 빠른 아이폰’에서 ‘인텔 아이리스 Xe, A13 바이오닉보다 62% 빠르다’로 바뀔 수 있다는 점에 주목하라.

또한, 진공 상태에서 그래픽 성능을 측정하는 신세틱 테스트는 CPU 성능이 영향을 미치는 실제 게임과는 똑같지 않다는 것을 알아야 한다. 

예를 들어, 라이젠 7 4800U와 라데온 성능이 11세대 타이거 레이크 칩에 비해 저조하다고 생각할 수 있다. 하지만 실제 게임 성능을 보면 그렇지 않다. 예를 들어, 데우스 엑스: 맨카인드 디바이디드(Deus Ex: Mankind Divided)를 플레이할 때, 라데온 그래픽을 탑재한 라이젠 7 4800U는 일대일 대결에서는 져도 인텔의 최신 11세대 타이거 레이크와 아이리스 Xe 그래픽 성능에 상당히 가깝다. 라이젠 7 4800U는 실제 게임 그래픽 부하에서 매우 우수하고 다만 인텔 아이리스 Xe가 더 성능이 높은 것이다.
 
ⓒ IDG
 

크로스 플랫폼 벤치마크가 까다로운 이유

크로스 플랫폼 벤치마크는 까다롭다. 결과를 적용할 때 이론이 실제 사용과 충돌하기 때문이다.

예를 들어, 3D마크 와일드 라이프에서 아이폰 12가 더 높은 점수를 받아도 삼성 갤럭시 노트 20 안드로이드폰 또는 레노보 슬림 7(Lenovo Slim 7) 윈도우 노트북보다 iOS에서 포트나이트 속도가 얼마나 더 빠른지 알 수 없다. iOS나 안드로이드에는 더 이상 공식 포트나이트가 없기 때문이다. 3D마크 와일드 라이프는 iOS나 안드로이드에서 스팀 게임을 얼마다 잘 실행할 수 있는지도 알려주지 않는다. 모바일에서 스팀 게임을 할 수 없기 때문이다. 

스마트폰과 태블릿, 노트북에 적용된 프라이메이트 랩(Primate Lab)의 긱벤치(Geekbench) 결과를 근거로 어떤 것이 더 빠르다고 말하는 보도도 있었다. 하지만 최신 ARM 기반 맥북에서 윈도우 앱을 실행할 수 없거나, 윈도우에서 맥OS 앱을 실행할 수 없다면 긱벤치 점수가 얼마나 중요할까?

제목만 그럴싸한 기사 제목보다는 최신 디바이스가 사용자의 작업, 게임, 애플리케이션을 기존 디바이스보다 얼마나 빨리 실행하는지를 나타내는 벤치마크가 훨씬 가치 있다. 예를 들면 아이폰 12과 아이폰 8끼리의 와일드 라이프 비교가 유용할 것이다. 픽셀 5 vs. 노트 울트라 20의 와일드 랜드(Wild Lands)가 유용하다. ARM 기반 맥북이 출시되면, 인텔 기반 맥북과의 와일드 랜드 비교는 더욱 유용하다. 어쨌든 두 종류의 맥북 모두, 와일드 랜드 결과보다는 포토샵이나 라이트 룸(Light Room), 엑셀, 크롬 등으로 실제 작업하는 성능을 보고 싶다. 

IT 뉴스 매체는 데이터베이스 결과 중에서 일부를 선택하거나 크로스 플랫폼 벤치마크를 사용해 예비 테스트를 실행하고, 성급하게 승자와 패자를 가르는 헤드라인을 쏟아내는 만큼, 앞으로 몇 주에서 몇 개월 동안은 실제와 벤치마크 결과 간의 차이점을 염두에 둬야 한다. 벤치마크 결과를 보는 것은 흥미롭지만, 한계가 있다는 점도 고려해야 한다.

예를 들어, 아래 차트에서 맨 위 2개의 녹색 막대는 별도 GPU를 탑재한 2종류의 노트북에서 실행한 와일드 라이프 언리미티드 결과를 나타낸다. 하나는 약 2.8kg짜리 게임용 노트북이고, 다른 하나는 약 1.3kg 무게의 콘텐츠 제작용 노트북이다. 
 
ⓒ IDG

확실히, 이 결과가 그저 우스꽝스럽다고 보는 사람도 있을 것이다. 2kg도 훨씬 넘는 게임용 노트북을 스마트폰과 비교할 수는 없기 때문이다. 사실이 그렇다. 스마트폰과 1.3kg짜리 노트북과 비교하는 것도 마찬가지로 어리석다. 사용 방식 자체가 다르기 때문이다. editor@itworld.co.kr



2020.10.29

"맥북보다, 라이젠보다, 인텔보다 빠른 아이폰?" 크로스플랫폼 벤치마크의 허와 실

Gordon Mah Ung | PCWorld
“인텔 기반 맥북보다 빠른 아이폰 12”
“최신 아이폰, 가장 빠른 윈도우 울트라북보다 빨라”
“ARM 기반 맥북, x86 맥북보다 2배 빨라”


애플이 신형 아이폰을 발표했으므로, 11월 중순쯤에는 최초로 인텔이 아닌 자체 설계 ARM 기반 프로세서 기반의 맥북을 출시할 것이 분명해 보인다. 곧 위와 같은 낚시성 기사 제목을 볼 수 있을지도 모른다.
 
스마트폰과 노트북 성능도 중요하지만, 맥락도 중요하다. 그렇기 때문에 UL 퓨처마크의 새로운 3D 마크 와일드 라이프 벤치마크(3DMark Wild Life Benchmark)의 작동 방식을 이해하는 것이 중요하다. 크로스 플랫폼 테스트로 알려진 와일드 라이프는 안드로이드와 iOS, 윈도우에서 실행할 수 있다. 지금 무료로 스마트폰이나 태블릿에서 실행할 수 있다. 어드반스드 에디션을 보유한 윈도우 사용자는 UL, 스팀 또는 그린 맨 게이밍 스토어에서 무료 업데이트를 받을 수 있다. 

특히 높이 살 만한 점은 UL이 3D 마크 와일드 라이프 작업에 매우 개방적이며, 테스트와 실행 방법의 세부정보를 제공한다는 점이다. UL은 윈도우에서 ‘경량 노트북과 태블릿’을 대상으로 한 그래픽 테스트이며, 벌컨(Vulkan) API를 사용한다. 안드로이드 버전은 벌컨 API에서도 실행되며, iOS 버전은 애플의 메탈 API를 사용한다. 
 
ⓒ UL
 
테스트에는 게임을 내부적으로 2560ⅹ1440 렌더링한 다음, 디스플레이 해상도로 확장하는 표준 모드가 있다. 전체 디바이스를 볼 때, UL은 표준 실행을 권장한다. 

실제 그래픽 칩 비교를 위해, UL은 언리미티드(Unlimited) 모드 사용을 권장한다. 이 모드는 정확한 프레임 수를 렌더링하므로 디스플레이 크기 조정과 수직 동기화, 운영체제가 점수에 영향을 미치지 않는다. 

상기 링크에서 UL이 제공하는 자료에 따르면, 와일드 라이프 그래픽 테스트는 지오메트리와 조명, 후처리 효과의 양을 여러 번 조정해 구성한 많은 장면으로 진행된다. 테스트의 중추는 클러스터된 조명 컬링을 사용하는 지연된 렌더러다. 후처리 효과에는 블룸(bloom)과 열 왜곡, 볼륨 조명, 피사계 심도가 포함된다.

UL의 자료에는 더 많은 내용이 있지만, 궁금한 것은 윈도우 노트북과 아이폰 모두에서 실행되는 와일드 라이프 언리미티드의 결과다. A14 바이오닉을 탑재한 최신 아이폰 12에 대한 결과는 없지만, MacWorld.com에서 받은 비슷한 사양의 제품에 대한 결과는 있다. 아이폰 11 프로 맥스가 인텔 UHD620 그래픽과 인텔 아이리스 플러스 그래픽을 능가한다고 한다. 나아가 AMD 라이젠 7 4800U에 탑재된 라데온 그래픽까지도 능가한다는 결과가 인상적이다. 
 
벤치마크로도 거짓말을 할 수 있다. ⓒ IDG

위의 벤치마크 차트를 보면, ‘아이폰 11 프로 맥스는 심지어 라이젠보다 빠르다!”고 판단하고 인터넷에 게시글을 올리기에 충분해 보인다.

그렇다면 A13 바이오닉을 탑재한 아이폰 11 프로 맥스가 벤치마크에서 이들 PC를 앞서는 이유는 무엇일까? 솔직히, 인텔의 구형 UHD 그래픽이 그렇게 쉽게 내쳐지는 것을 봐도 놀랍지 않다. 이 제품이 환영 받지 못한 지도 이미 오래다. 애플이 인텔과 헤어진 이유로 UHD만을 언급했다면, 이를 납득하고 이 결별에 대해 푸념하면서 애플을 위로했을 것이다. 

그런데 왜 인텔 아이리스 플러스 그리고 AMD 라데온과 비교를 했을까? 무엇보다 아이폰과 비교한 이유가 무엇일까?

이유는 많다. 첫 번째는 3D마크 와일드 라이프가 벌컨 API에서 실행된다는 것이다. PC의 경우, 대부분의 게임은 여전히 마이크로소프트의 다이렉트엑스를 기반으로 한다. 다이렉트엑스를 기반으로 수익을 창출하기 때문에, 대부분의 드라이버 최적화가 여기에 포함된다. 

두 번째 이유는 애플이 절대반지를 만드는 사우론처럼 ARM 기반 A 시리즈 칩에 막대한 자원과 기술을 쏟아 부었기 때문이다. 속도는 의심할 여지가 없고, 윈도우에서의 벌컨과 달리, 애플의 메탈(Metal) 성능은 틀림없이 최우선순위에 있다. 게임 콘솔과 마찬가지로, API와 하드웨어 제작 역량을 둘 다 가질 경우 얻을 수 있는 효과다.

물론, 벤치마크 결과를 책임감 있게 표현하려면 “PC보다 빠른 아이폰!” 같은 낚시성 기사 제목보다 더 많은 맥락을 포함해야 한다. PCWorld는 인텔의 새로운 11 세대 타이거 레이크 코어(Tiger Lake Core) i7-1165G7을 탑재한 에이수스 젠북 플립(Asus ZenBook Flip) 프로덕션 버전을 테스트할 수 있었다. 
 
ⓒ IDG

당연히 맨 위에 있는 파란색 선은 인텔의 타이거 레이크 칩과 아이리스 Xe다. 여기 사용된 얇은 경량 젠북 플립의 코어 i7-1167G7 역시 가장 빠른 칩은 아니다. 다만 기사 제목이 한순간에 ‘라이젠과 아이스레이크보다 빠른 아이폰’에서 ‘인텔 아이리스 Xe, A13 바이오닉보다 62% 빠르다’로 바뀔 수 있다는 점에 주목하라.

또한, 진공 상태에서 그래픽 성능을 측정하는 신세틱 테스트는 CPU 성능이 영향을 미치는 실제 게임과는 똑같지 않다는 것을 알아야 한다. 

예를 들어, 라이젠 7 4800U와 라데온 성능이 11세대 타이거 레이크 칩에 비해 저조하다고 생각할 수 있다. 하지만 실제 게임 성능을 보면 그렇지 않다. 예를 들어, 데우스 엑스: 맨카인드 디바이디드(Deus Ex: Mankind Divided)를 플레이할 때, 라데온 그래픽을 탑재한 라이젠 7 4800U는 일대일 대결에서는 져도 인텔의 최신 11세대 타이거 레이크와 아이리스 Xe 그래픽 성능에 상당히 가깝다. 라이젠 7 4800U는 실제 게임 그래픽 부하에서 매우 우수하고 다만 인텔 아이리스 Xe가 더 성능이 높은 것이다.
 
ⓒ IDG
 

크로스 플랫폼 벤치마크가 까다로운 이유

크로스 플랫폼 벤치마크는 까다롭다. 결과를 적용할 때 이론이 실제 사용과 충돌하기 때문이다.

예를 들어, 3D마크 와일드 라이프에서 아이폰 12가 더 높은 점수를 받아도 삼성 갤럭시 노트 20 안드로이드폰 또는 레노보 슬림 7(Lenovo Slim 7) 윈도우 노트북보다 iOS에서 포트나이트 속도가 얼마나 더 빠른지 알 수 없다. iOS나 안드로이드에는 더 이상 공식 포트나이트가 없기 때문이다. 3D마크 와일드 라이프는 iOS나 안드로이드에서 스팀 게임을 얼마다 잘 실행할 수 있는지도 알려주지 않는다. 모바일에서 스팀 게임을 할 수 없기 때문이다. 

스마트폰과 태블릿, 노트북에 적용된 프라이메이트 랩(Primate Lab)의 긱벤치(Geekbench) 결과를 근거로 어떤 것이 더 빠르다고 말하는 보도도 있었다. 하지만 최신 ARM 기반 맥북에서 윈도우 앱을 실행할 수 없거나, 윈도우에서 맥OS 앱을 실행할 수 없다면 긱벤치 점수가 얼마나 중요할까?

제목만 그럴싸한 기사 제목보다는 최신 디바이스가 사용자의 작업, 게임, 애플리케이션을 기존 디바이스보다 얼마나 빨리 실행하는지를 나타내는 벤치마크가 훨씬 가치 있다. 예를 들면 아이폰 12과 아이폰 8끼리의 와일드 라이프 비교가 유용할 것이다. 픽셀 5 vs. 노트 울트라 20의 와일드 랜드(Wild Lands)가 유용하다. ARM 기반 맥북이 출시되면, 인텔 기반 맥북과의 와일드 랜드 비교는 더욱 유용하다. 어쨌든 두 종류의 맥북 모두, 와일드 랜드 결과보다는 포토샵이나 라이트 룸(Light Room), 엑셀, 크롬 등으로 실제 작업하는 성능을 보고 싶다. 

IT 뉴스 매체는 데이터베이스 결과 중에서 일부를 선택하거나 크로스 플랫폼 벤치마크를 사용해 예비 테스트를 실행하고, 성급하게 승자와 패자를 가르는 헤드라인을 쏟아내는 만큼, 앞으로 몇 주에서 몇 개월 동안은 실제와 벤치마크 결과 간의 차이점을 염두에 둬야 한다. 벤치마크 결과를 보는 것은 흥미롭지만, 한계가 있다는 점도 고려해야 한다.

예를 들어, 아래 차트에서 맨 위 2개의 녹색 막대는 별도 GPU를 탑재한 2종류의 노트북에서 실행한 와일드 라이프 언리미티드 결과를 나타낸다. 하나는 약 2.8kg짜리 게임용 노트북이고, 다른 하나는 약 1.3kg 무게의 콘텐츠 제작용 노트북이다. 
 
ⓒ IDG

확실히, 이 결과가 그저 우스꽝스럽다고 보는 사람도 있을 것이다. 2kg도 훨씬 넘는 게임용 노트북을 스마트폰과 비교할 수는 없기 때문이다. 사실이 그렇다. 스마트폰과 1.3kg짜리 노트북과 비교하는 것도 마찬가지로 어리석다. 사용 방식 자체가 다르기 때문이다. editor@itworld.co.kr

X