Offcanvas

AI / 비즈니스|경제 / 소비자IT / 소프트스킬 / 신기술|미래 / 인문학|교양

구글 AI 프로그램, 아타리 벽돌게임 마스터··· "혼자서 통달"

2015.02.27 Tim Hornyak  |  IDG News Service

구글 인공지능 프로그램이 클래식 아타리 비디오 게임을 통달하는 수준을 달성했다.

구글은 지난 해 런던에 소재한 AI 기업 딥마인드(DeepMind)를 인수한 바 있다. 구글에 따르면 이 회사가 개발한 딥 Q-네트워크(DQN)는 아타리 2600 비디오 게임을 진행할 수 있도록 스스로 학습해가는 능력을 갖췄다. 입력 정보는 점수와 픽셀 디스플레이 뿐이었다.

구글 딥마인드의 데미스 하사비스와 공동 연구진은 네이처 지에 기고한 논문에서 이번 프로그램이 49종의 게임 테스트에서 기존 알고리즘들의 성능을 넘어섰다고 밝혔다. 전문 게임테스터의 역량에 필적하는 수준이었다는 설명이다.

연구진에 따르면 이 프로그램은 규칙을 모른 채 게임을 시작했다. 점수를 최대화하려는 동기 요소와 이전 게임으로부터 학습할 수 있는 능력이 있었을 뿐이다. 그 결과 이 프로그램은 비디오 핀본(Video Pinball)과 브레이크아웃(Breakout) 등의 게임을 우수하게 진행해냈다.



이 AI 시스템의 학습 동기 요소로 활용된 접근법은 '재강화 학습'(reinforcement learning)이라는 것이었다. 연구진은 이를 '딥 뉴럴 네트워크'라고 불리는 인공 신경 네트워크와 결합했다. 이 인공 신경 네트워크는 데이터의 의미를 추출하기 위해 다양한 연산 레이어를 이용할 수 있는 역량을 보유했다.

연구팀은 생리학적으로 영감받는 아키텍처에 초점을 맞췄다. 심화 소용돌이형 네트워크(deep convolutional network)로 알려진 이 아키텍처는 매릴랜드 대학 연구진이 로봇에게 요리 및 유튜브 시청법을 스스로 학습하도록 하기 위해 적용했던 것과 유사한 접근법이다.

연구진은 DQN 알고리즘이 횡스크롤 슈팅 게임, 복싱 경기, 3D 자동차 레이싱 등 다양한 게임에서 탁월한 성과를 보였다며, 49개의 게임 중 29개에서 인간 점수의 75% 이상을 달성했다고 밝혔다.

더욱 유의미한 결과는 이 알고리즘이 세션이 지남에 따라 전략을 학습해갔다는 점이라고 연구진은 강조했다.

브레이크아웃 게임을 600 세션 진행한 후 이 알고리즘은 게이머가 파괴해야만 하는 벽돌벽 뒷면으로 터널링(tunneling)하는 승리 전략을 학습했다. 볼을 터널로 반복해 보냄으로써 더 많은 벽돌을 파괴하는 법을 깨달았던 것이라고 연구진은 설명했다.

연구진은 알고리즘이 비디오 게임을 학습한 사례가 이번이 처음이 아니며, 장기 전략이 요구되는 몬테주마의 복수와 같은 게임에서는 성과가 부진하기도 했었다고 인정하면서도 단일 아키첵처가 학습하고 적응한 의미있는 사례라고 밝혔다. 범용 AI 프로그램 구축과 관련해 또 하나의 진전이라는 설명이다. ciokr@idg.co.kr
 

Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.