2018.12.03

NFL 리그가 AWS 세이지메이커를 이용하는 방법

Scott Carey | Computerworld UK
미국에서 가장 있는 스포츠 리그가 AWS의 머신러닝 도구를 사용해 스포츠 팬과의 교류를 확대하고 있다.

미 내셔널 풋볼 리그(NFL)가 AWS의 세이지메이커(SageMaker) 머신러닝 툴킷을 활용하는 방법은 시청자들에게 새롭고 복잡한 통계값을 서비스의 일환으로 제공하는 것이다. 

리그는 2015년부터 지브라 테크놀로지의 RFID 칩을 축구공과 선수에 부착시켰다. 이를 통해 시즌 당 1TB의 GPS 데이터를 수집했다. NFL 넥스트 젠 스탯(NFL Next Gen Stats)의 마이클 치 디렉터는 지난주 열린 아마존 리인벤트 컨퍼런스에서서 "이를 통해 NFL 팬들이 게임을 좀더 즐길 수 있게 했다"라고 설명했다. 

즉, 팬들은 이를 통해 선수의 패스 성공률, 패스를 잡을 확률 등에 대한 예측값을 확인할 수 있다. 특히 이러한 데이터는 ESPN과 같은 방송사로 실시간 공유되어 재미를 더한다. 코치나 구단 직원들은 경기가 끝난 후 게임에 대한 통찰도 얻게 된다. 

작년 리인벤트 컨퍼런스에서 발표된 세이지메이커는 전문가가 아니더라도 머신러닝 모델을 쉽게 구축, 교육, 배포할 수 있도록 해주는 AWS 플랫폼이다. 

치 디렉터는 리그 측이 파생 값(derived metrics)과 규칙 기반 통계(rule-based stats)라는 두 가지 유형의 값을 주로 처리한다고 설명했다.

이를테념 에어 야드(air yeards)가 있다. 쿼터백의 손을 벗어난 공이 공중에서 얼마나 멀리 이동하는 이 값이 일종의 파생 값이다. 추적 데이터를 보유하고 리시버와 스크럼 라인이 어디 있는지 알면, 추적할 수 있는 값이다.

규칙 기반 통계는 '커버리지'와 같이 보다 어렵고 알고리즘적인 통계를 기반으로 한다. 이를 통해 어떤 수비수가 리시버를 차단하는지, 얼마나 잘 수비하고 있는지를 파악할 수 있다. 

NFL NGS 팀은 이제 최신 통계값이 '완료 확률'을 서비스하려 하고 있다. 수신자 분리값, 송구 시간, 돌진 선수로부터의 쿼터백 분리값, 스크램블 야드, 에어 야드 등 10가지 값을 채택해 NGS 부서는 지난 두 시가의 3만 5,000여 패스 플레이 데이터를 분석함으로써 모델을 교육시켰다. 

치는 오픈소스 XG부스트 그라디언트 부스팅 알고리즘을 사용해 70-20-10 트레인 / 검증 / 테스트 방법론을 사용함으로써 최고의 성능 모델을 검증 할 수 있었다고 설명했다. ciokr@idg.co.kr



2018.12.03

NFL 리그가 AWS 세이지메이커를 이용하는 방법

Scott Carey | Computerworld UK
미국에서 가장 있는 스포츠 리그가 AWS의 머신러닝 도구를 사용해 스포츠 팬과의 교류를 확대하고 있다.

미 내셔널 풋볼 리그(NFL)가 AWS의 세이지메이커(SageMaker) 머신러닝 툴킷을 활용하는 방법은 시청자들에게 새롭고 복잡한 통계값을 서비스의 일환으로 제공하는 것이다. 

리그는 2015년부터 지브라 테크놀로지의 RFID 칩을 축구공과 선수에 부착시켰다. 이를 통해 시즌 당 1TB의 GPS 데이터를 수집했다. NFL 넥스트 젠 스탯(NFL Next Gen Stats)의 마이클 치 디렉터는 지난주 열린 아마존 리인벤트 컨퍼런스에서서 "이를 통해 NFL 팬들이 게임을 좀더 즐길 수 있게 했다"라고 설명했다. 

즉, 팬들은 이를 통해 선수의 패스 성공률, 패스를 잡을 확률 등에 대한 예측값을 확인할 수 있다. 특히 이러한 데이터는 ESPN과 같은 방송사로 실시간 공유되어 재미를 더한다. 코치나 구단 직원들은 경기가 끝난 후 게임에 대한 통찰도 얻게 된다. 

작년 리인벤트 컨퍼런스에서 발표된 세이지메이커는 전문가가 아니더라도 머신러닝 모델을 쉽게 구축, 교육, 배포할 수 있도록 해주는 AWS 플랫폼이다. 

치 디렉터는 리그 측이 파생 값(derived metrics)과 규칙 기반 통계(rule-based stats)라는 두 가지 유형의 값을 주로 처리한다고 설명했다.

이를테념 에어 야드(air yeards)가 있다. 쿼터백의 손을 벗어난 공이 공중에서 얼마나 멀리 이동하는 이 값이 일종의 파생 값이다. 추적 데이터를 보유하고 리시버와 스크럼 라인이 어디 있는지 알면, 추적할 수 있는 값이다.

규칙 기반 통계는 '커버리지'와 같이 보다 어렵고 알고리즘적인 통계를 기반으로 한다. 이를 통해 어떤 수비수가 리시버를 차단하는지, 얼마나 잘 수비하고 있는지를 파악할 수 있다. 

NFL NGS 팀은 이제 최신 통계값이 '완료 확률'을 서비스하려 하고 있다. 수신자 분리값, 송구 시간, 돌진 선수로부터의 쿼터백 분리값, 스크램블 야드, 에어 야드 등 10가지 값을 채택해 NGS 부서는 지난 두 시가의 3만 5,000여 패스 플레이 데이터를 분석함으로써 모델을 교육시켰다. 

치는 오픈소스 XG부스트 그라디언트 부스팅 알고리즘을 사용해 70-20-10 트레인 / 검증 / 테스트 방법론을 사용함으로써 최고의 성능 모델을 검증 할 수 있었다고 설명했다. ciokr@idg.co.kr

X