2021.07.14

칼럼|인공지능은 허풍이 필요한 단계를 지났다

Matt Asay | InfoWorld
AI에 관한 과장 광고, 그 중에서도 특히 자율 주행차에 관한 허풍이 넘쳐나고 있음에도 불구하고, AI는 코드를 작성하거나, 구글 반도체를 설계하거나, AI 산출물의 신뢰 가능성을 스스로 알려주기도 한다. 

AI에 관한 수많은 허풍으로 인해, 여러 분야의 기업들이 AI로 실질적인 성과를 거두고 있다는 점을 간과하기 쉽다. 필자는 지금 AI 기반 ‘완전 자율 주행 기술’에 관한 테슬라의 과장 마케팅이 실질 성과라고 말하려는 게 아니다. 안드레센 호로위츠의 애널리스트인 베네딕트 에반스는 지난 7일 트위터를 통해 (테슬라는) “완전 자율 주행 베타버전 9 소프트웨어를 곧 출시할 예정이라고는 하지만, 사실상 완벽한 자율 주행 기술이 아닐 뿐 아니라 거기에 근접하지도 않는다"라고 말하기도 했다. 

차라리 필자는 오라일리의 콘텐츠 전략 부사장인 마이크 루키데스가 정리한 실제 AI 사례에 관해 언급하고자 한다. 여기에는 ‘그다지 완벽하지 않은’ 자율 주행 기술도 포함돼 있다. 

최근 진행된 한 설문조사에 따르면, AI를 제대로 만들려면 무엇보다도 자본과 양질의 데이터가 필요한 것으로 나타났다. 이런 요소가 갖춰져 있다는 전제하에, AI가 단지 마케팅 용도가 아니라 삶을 윤택하게 만들 수 있는 도구로 활용되고 있는 사례 몇 가지를 살펴보고자 한다.
 
ⓒGetty Images Bank

사람을 대신해 코드 작성
AI를 통한 생산성 향상에 있어 주목할 만한 최근의 실험작 중 하나는 깃허브 코파일럿이다. 스마트폰(혹은 지메일 등)이 단어나 문구를 제안해주는 것처럼, 코파일럿은 코드나 함수를 제안해 개발자의 코드 작성 과정을 지원한다. 깃허브상의 코드 수십억 줄을 학습한 코파일럿은 보다 간결하면서도 효율적인 코드 작성을 지원해 개발자의 생산성을 높이는 것을 목표로 한다.

코파일럿이 제 역할을 할 수 있을지 판단하기엔 아직 너무 이르다. 필자는 지금 코파일럿이 목표한 바를 해낼 수 있는지 여부를 말하려는 게 아니다. 코파일럿을 시범 사용해본 여러 개발자들은 코파일럿의 잠재력에 찬사를 아끼지 않았다. 하지만 사이먼 비슨이 지적한 대로, 코파일럿에 관한 우려도 있다. 
 

코파일럿이 정확한 코드를 생성할 것이라고 기대해서는 안 된다. 우선, 코파일럿 같은 유형의 활용 사례는 아직 초창기 수준에 머물러 있다. 기초적인 수준의 데이터세트밖에 학습하지 못한 상황이다. 코파일럿은 제안한 코드를 사용자들이 이용하는 양상을 바탕으로 강화 학습을 진행하며, 이를 통해 코드 제안 역량을 점점 개선해 나간다. 그럼에도 어떤 스니펫(snippet)을, 어떻게 사용할 것인지에 대한 결정은 이용자가 직접 해야 한다. 또한, 보안상의 이유로 코파일럿이 생성하는 코드에 주의를 기울여야 한다.


무엇보다도 저작권과 오픈소스에 대한 우려도 있다. 어떤 이들은 코파일럿이 이론적으로는 훌륭하다고 생각한다. 하지만 막상 코드 작성 과정에서 개발자들은 코파일럿을 별로 신경쓰지 않을 것이다. 따라서 개발자들이 코파일럿의 제안 코드가 실제로 코딩에 유용하다고 생각할지 여부가 관건이다. 정말 뛰어난 AI라면 인간 대신 창의력을 발휘하는 게 아니라, 인간의 창의력을 증강시키는 법이다.

-> 깃허브 코파일럿, 개발자 반응은?··· "놀랍도록 유용"vs"아직 미흡"

진짜 자율 주행 
오늘날 자율 주행차는 자율 주행이 불가능한 게 현실이다. 하지만 운전자의 부담을 조금 덜어줄 수는 있다 (일론 머스크가 차라리 이 점을 내세웠더라면 좋았을 것이다). 

자율 주행차가 내건 약속은 제대로 지켜지지 못했다. GPS는 오작동할 수 있기 때문이다. 칼텍의 과학자들은 사이언스 로보틱스 저널을 통해 "시각적 지형 비교 탐색(VTRN)을 위해 계절적 변화에도 불변하는 심층 트랜스폼"을 고안했다고 밝힌 바 있다. 쉽게 말해, 이는 (자동차 등의) 자율 시스템이 주변 지형으로부터 정보를 수집해 스스로의 위치를 정확히 파악할 수 있는 방식이다. 주변 지형이 눈, 낙엽 또는 수풀로 덮여 있더라도 상관없다는 의미다. 

현재의 자율 주행 기술은 매핑/지형 데이터와 차량이 ‘인식하는 정보’를 거의 정확하게 대응시키는 과정이 필요하다. 하지만, 눈(snow)을 비롯한 여타 지형지물이 차량의 지형 인식을 방해할 수 있다. 이에 칼텍 과학자들은 접근법을 달리해 자기 지도 학습법을 사용했다.  

이들은 "대부분의 컴퓨터 비전은 데이터에 주석을 다는 사람에게 의존적이다. 이들은 정밀하게 큐레이션한 대규모 데이터를 바탕으로, 알고리즘이 사물을 인식하도록 학습시킨다. 반면, 자기 지도 학습법은 알고리즘이 스스로 학습하는 방식이다. 인공지능이 사람이 놓칠 수 있는 디테일과 특징을 파악함으로써 이미지 속 패턴을 찾는다”라고 설명했다. 이러한 딥러닝 방식을 이용해, 기계 장치가 주변 환경을 보다 정밀하게 관찰하고 반응할 수 있는 방안을 고안한 셈이다. 단, 자동차 주변의 사물이 대부분 자동차라는 점에서, 칼텍 과학자들의 방식은 유용성에 한계가 있을 수 있다. 

한편, 자율 주행차에 관한 다른 접근법도 있다. 플로리다 애틀랜틱 대학교의 공학 및 컴퓨터과학 대학 소속의 한 과학자는 운전자의 감정 상태를 파악해 자율 주행 시스템을 제어할 수 있는 신기술을 개발했다. 특허가 부여된 이 기술을 차량 생산에 도입한 업체는 아직 없다.

위의 두 기술은 자율 주행 차량의 안전성과 신뢰성을 보다 전체적으로 바라봐야 함을 시사한다.  

신뢰성 문제를 극복
이 모든 사례들은 다소 추정에 기반하고 있지만, 구글이 최근 칩 설계 과정에서 이룬 성취는 추정이 아니다. 구글 엔지니어들은 최근 네이처를 통해 반도체 구성요소의 배치 설계 작업인 평면 배치(floor planning)에 참신한 접근법을 도입했다고 밝힌 바 있다. 

여러 엔지니어들이 지난 수십 년간 이 배치 작업을 자동화하려고 시도했지만 성공하지 못했다. 하지만 구글 엔지니어들은 머신러닝을 활용함으로써 수개월 걸리던 반도체 설계 작업을 불과 6시간만에 끝냈다. 어떻게 이것이 가능했을까? 이들은 평면 배치를 강화 학습으로 해결할 수 있는 문제로 접근해, 반도체의 다양한 표상을 학습할 수 있는 엣지 기반 그래프 컨볼루션 신경 네트워크 아키텍처를 개발하는 쪽으로 방향성을 잡았다.

이를 구현하기 위해 엔지니어들은 인공지능 에이전트에 반도체 배치 설계 1만 종을 학습시켰다. 이후, 에이전트는 강화학습을 바탕으로 다음 블록을 반도체의 어디에 배치할지 결정하기 위해 기존의 우수 평면 배치 데이터를 학습했다. 배치 설계의 각 단계에서, 에이전트는 지금까지 구축한 배치 설계 등 개발되고 있는 반도체의 ‘상태’를 평가한다. 이어, 학습 전략을 바탕으로 최선의 동작을 식별한다. 즉, 매크로 블록을 어디에 배치할지 결정한다. 자세한 내용은 이곳에서 볼 수 있다. 

대단한 성취가 아닐 수 없다. 하지만 이보다 더 대단한 사실은, 이 인공지능이 현재 구글의 칩 생산 과정에 활용되고 있다는 점이다. 이는 구글이 (인공지능을 이용한) 반도체 평면 배치를 신뢰한다는 의미다. 

이 사례는 IBM의 불확실성 정량화 360(UQ360)를 떠올리게 한다. AI와 관련한 과제 중 하나는 AI의 산출물에 대한 신뢰 가능성이다. AI는 데이터를 기반으로 한다. 하지만, 만약 그 데이터 자체를 신뢰하기 어렵거나 머신이 데이터를 이용해 하려는 작업을 믿기 어려운 상황이라면 AI가 운전대를 잡도록 내버려둘 두는 없다. IBM에 따르면 UQ360은 "파이썬 패키지가 포함된 오픈소스 툴킷으로, AI 투명성이라는 공통의 프랙티스를 위해 데이터 과학 실무자와 개발자가 최신 알고리즘에 액세스할 수 있게 함으로써 머신러닝 모델의 불확실성을 추정, 평가, 개선 및 전달하는 과정을 간소화”해준다.

달리 말해, UQ360은 AI가 하고자 하는 작업을 얼마나 신뢰할 수 있는지 추정하기 위해 AI를 이용한다. 

AI가 세상을 주도해나가는 가운데, UQ 360 같은 제품은 AI의 신뢰성을 높여준다는 점에서 중요하다. 로봇이 일자리를 빼앗고 있다는 얘기가 들린 지 수년째다. 하지만 AI는 관심사와 구매 기화를 매칭하는 데 서툴렀다. (위 사례들을 보면) AI는 점점 더 유용성을 보이고 있다. AI의 유용성을 입증하기 위해 굳이 과장할 필요가 없다. ciokr@idg.co.kr
 



2021.07.14

칼럼|인공지능은 허풍이 필요한 단계를 지났다

Matt Asay | InfoWorld
AI에 관한 과장 광고, 그 중에서도 특히 자율 주행차에 관한 허풍이 넘쳐나고 있음에도 불구하고, AI는 코드를 작성하거나, 구글 반도체를 설계하거나, AI 산출물의 신뢰 가능성을 스스로 알려주기도 한다. 

AI에 관한 수많은 허풍으로 인해, 여러 분야의 기업들이 AI로 실질적인 성과를 거두고 있다는 점을 간과하기 쉽다. 필자는 지금 AI 기반 ‘완전 자율 주행 기술’에 관한 테슬라의 과장 마케팅이 실질 성과라고 말하려는 게 아니다. 안드레센 호로위츠의 애널리스트인 베네딕트 에반스는 지난 7일 트위터를 통해 (테슬라는) “완전 자율 주행 베타버전 9 소프트웨어를 곧 출시할 예정이라고는 하지만, 사실상 완벽한 자율 주행 기술이 아닐 뿐 아니라 거기에 근접하지도 않는다"라고 말하기도 했다. 

차라리 필자는 오라일리의 콘텐츠 전략 부사장인 마이크 루키데스가 정리한 실제 AI 사례에 관해 언급하고자 한다. 여기에는 ‘그다지 완벽하지 않은’ 자율 주행 기술도 포함돼 있다. 

최근 진행된 한 설문조사에 따르면, AI를 제대로 만들려면 무엇보다도 자본과 양질의 데이터가 필요한 것으로 나타났다. 이런 요소가 갖춰져 있다는 전제하에, AI가 단지 마케팅 용도가 아니라 삶을 윤택하게 만들 수 있는 도구로 활용되고 있는 사례 몇 가지를 살펴보고자 한다.
 
ⓒGetty Images Bank

사람을 대신해 코드 작성
AI를 통한 생산성 향상에 있어 주목할 만한 최근의 실험작 중 하나는 깃허브 코파일럿이다. 스마트폰(혹은 지메일 등)이 단어나 문구를 제안해주는 것처럼, 코파일럿은 코드나 함수를 제안해 개발자의 코드 작성 과정을 지원한다. 깃허브상의 코드 수십억 줄을 학습한 코파일럿은 보다 간결하면서도 효율적인 코드 작성을 지원해 개발자의 생산성을 높이는 것을 목표로 한다.

코파일럿이 제 역할을 할 수 있을지 판단하기엔 아직 너무 이르다. 필자는 지금 코파일럿이 목표한 바를 해낼 수 있는지 여부를 말하려는 게 아니다. 코파일럿을 시범 사용해본 여러 개발자들은 코파일럿의 잠재력에 찬사를 아끼지 않았다. 하지만 사이먼 비슨이 지적한 대로, 코파일럿에 관한 우려도 있다. 
 

코파일럿이 정확한 코드를 생성할 것이라고 기대해서는 안 된다. 우선, 코파일럿 같은 유형의 활용 사례는 아직 초창기 수준에 머물러 있다. 기초적인 수준의 데이터세트밖에 학습하지 못한 상황이다. 코파일럿은 제안한 코드를 사용자들이 이용하는 양상을 바탕으로 강화 학습을 진행하며, 이를 통해 코드 제안 역량을 점점 개선해 나간다. 그럼에도 어떤 스니펫(snippet)을, 어떻게 사용할 것인지에 대한 결정은 이용자가 직접 해야 한다. 또한, 보안상의 이유로 코파일럿이 생성하는 코드에 주의를 기울여야 한다.


무엇보다도 저작권과 오픈소스에 대한 우려도 있다. 어떤 이들은 코파일럿이 이론적으로는 훌륭하다고 생각한다. 하지만 막상 코드 작성 과정에서 개발자들은 코파일럿을 별로 신경쓰지 않을 것이다. 따라서 개발자들이 코파일럿의 제안 코드가 실제로 코딩에 유용하다고 생각할지 여부가 관건이다. 정말 뛰어난 AI라면 인간 대신 창의력을 발휘하는 게 아니라, 인간의 창의력을 증강시키는 법이다.

-> 깃허브 코파일럿, 개발자 반응은?··· "놀랍도록 유용"vs"아직 미흡"

진짜 자율 주행 
오늘날 자율 주행차는 자율 주행이 불가능한 게 현실이다. 하지만 운전자의 부담을 조금 덜어줄 수는 있다 (일론 머스크가 차라리 이 점을 내세웠더라면 좋았을 것이다). 

자율 주행차가 내건 약속은 제대로 지켜지지 못했다. GPS는 오작동할 수 있기 때문이다. 칼텍의 과학자들은 사이언스 로보틱스 저널을 통해 "시각적 지형 비교 탐색(VTRN)을 위해 계절적 변화에도 불변하는 심층 트랜스폼"을 고안했다고 밝힌 바 있다. 쉽게 말해, 이는 (자동차 등의) 자율 시스템이 주변 지형으로부터 정보를 수집해 스스로의 위치를 정확히 파악할 수 있는 방식이다. 주변 지형이 눈, 낙엽 또는 수풀로 덮여 있더라도 상관없다는 의미다. 

현재의 자율 주행 기술은 매핑/지형 데이터와 차량이 ‘인식하는 정보’를 거의 정확하게 대응시키는 과정이 필요하다. 하지만, 눈(snow)을 비롯한 여타 지형지물이 차량의 지형 인식을 방해할 수 있다. 이에 칼텍 과학자들은 접근법을 달리해 자기 지도 학습법을 사용했다.  

이들은 "대부분의 컴퓨터 비전은 데이터에 주석을 다는 사람에게 의존적이다. 이들은 정밀하게 큐레이션한 대규모 데이터를 바탕으로, 알고리즘이 사물을 인식하도록 학습시킨다. 반면, 자기 지도 학습법은 알고리즘이 스스로 학습하는 방식이다. 인공지능이 사람이 놓칠 수 있는 디테일과 특징을 파악함으로써 이미지 속 패턴을 찾는다”라고 설명했다. 이러한 딥러닝 방식을 이용해, 기계 장치가 주변 환경을 보다 정밀하게 관찰하고 반응할 수 있는 방안을 고안한 셈이다. 단, 자동차 주변의 사물이 대부분 자동차라는 점에서, 칼텍 과학자들의 방식은 유용성에 한계가 있을 수 있다. 

한편, 자율 주행차에 관한 다른 접근법도 있다. 플로리다 애틀랜틱 대학교의 공학 및 컴퓨터과학 대학 소속의 한 과학자는 운전자의 감정 상태를 파악해 자율 주행 시스템을 제어할 수 있는 신기술을 개발했다. 특허가 부여된 이 기술을 차량 생산에 도입한 업체는 아직 없다.

위의 두 기술은 자율 주행 차량의 안전성과 신뢰성을 보다 전체적으로 바라봐야 함을 시사한다.  

신뢰성 문제를 극복
이 모든 사례들은 다소 추정에 기반하고 있지만, 구글이 최근 칩 설계 과정에서 이룬 성취는 추정이 아니다. 구글 엔지니어들은 최근 네이처를 통해 반도체 구성요소의 배치 설계 작업인 평면 배치(floor planning)에 참신한 접근법을 도입했다고 밝힌 바 있다. 

여러 엔지니어들이 지난 수십 년간 이 배치 작업을 자동화하려고 시도했지만 성공하지 못했다. 하지만 구글 엔지니어들은 머신러닝을 활용함으로써 수개월 걸리던 반도체 설계 작업을 불과 6시간만에 끝냈다. 어떻게 이것이 가능했을까? 이들은 평면 배치를 강화 학습으로 해결할 수 있는 문제로 접근해, 반도체의 다양한 표상을 학습할 수 있는 엣지 기반 그래프 컨볼루션 신경 네트워크 아키텍처를 개발하는 쪽으로 방향성을 잡았다.

이를 구현하기 위해 엔지니어들은 인공지능 에이전트에 반도체 배치 설계 1만 종을 학습시켰다. 이후, 에이전트는 강화학습을 바탕으로 다음 블록을 반도체의 어디에 배치할지 결정하기 위해 기존의 우수 평면 배치 데이터를 학습했다. 배치 설계의 각 단계에서, 에이전트는 지금까지 구축한 배치 설계 등 개발되고 있는 반도체의 ‘상태’를 평가한다. 이어, 학습 전략을 바탕으로 최선의 동작을 식별한다. 즉, 매크로 블록을 어디에 배치할지 결정한다. 자세한 내용은 이곳에서 볼 수 있다. 

대단한 성취가 아닐 수 없다. 하지만 이보다 더 대단한 사실은, 이 인공지능이 현재 구글의 칩 생산 과정에 활용되고 있다는 점이다. 이는 구글이 (인공지능을 이용한) 반도체 평면 배치를 신뢰한다는 의미다. 

이 사례는 IBM의 불확실성 정량화 360(UQ360)를 떠올리게 한다. AI와 관련한 과제 중 하나는 AI의 산출물에 대한 신뢰 가능성이다. AI는 데이터를 기반으로 한다. 하지만, 만약 그 데이터 자체를 신뢰하기 어렵거나 머신이 데이터를 이용해 하려는 작업을 믿기 어려운 상황이라면 AI가 운전대를 잡도록 내버려둘 두는 없다. IBM에 따르면 UQ360은 "파이썬 패키지가 포함된 오픈소스 툴킷으로, AI 투명성이라는 공통의 프랙티스를 위해 데이터 과학 실무자와 개발자가 최신 알고리즘에 액세스할 수 있게 함으로써 머신러닝 모델의 불확실성을 추정, 평가, 개선 및 전달하는 과정을 간소화”해준다.

달리 말해, UQ360은 AI가 하고자 하는 작업을 얼마나 신뢰할 수 있는지 추정하기 위해 AI를 이용한다. 

AI가 세상을 주도해나가는 가운데, UQ 360 같은 제품은 AI의 신뢰성을 높여준다는 점에서 중요하다. 로봇이 일자리를 빼앗고 있다는 얘기가 들린 지 수년째다. 하지만 AI는 관심사와 구매 기화를 매칭하는 데 서툴렀다. (위 사례들을 보면) AI는 점점 더 유용성을 보이고 있다. AI의 유용성을 입증하기 위해 굳이 과장할 필요가 없다. ciokr@idg.co.kr
 

X