2018.03.02

칼럼 | 'AI를 가장한 룰 엔진' 여러분의 솔루션은 진짜 AI입니까?

Roger A. Grimes | CSO
클라우드, 패브릭, 비트코인, 블록체인, 컨테이너, 마이크로서비스 등 새로운 기술은 새로운 유행어를 만들어 낸다. 인공 지능(AI)이라는 기술 및 용어 역시 10년도 더 전부터 있었던 것이지만 유행어가 된 것은 최근이다.



그러나, 유감스럽게도 일부 업체는 실제적인 AI 기술이 없음에도 불구하고 유행한다는 이유로 아무 데나 AI라는 용어를 가져다 붙인다. 이들이 AI가 무엇인지 잘 모르는 것일 수도, 아니면 소비자가 마케팅 팀의 감언이설에 넘어간 것일 수도 있지만, 어느 쪽이든 구매자 입장에서는 AI가 아닌 것에 AI라는 용어를 쓰는 것은 아닌지 주의 깊게 살펴 봐야 한다.

필자는 최근 다양한 업체의 제품을 살펴 봤다. 이들 대부분은 상품 설명에 AI라는 단어가 들어가면 판매량을 늘릴 수 있다고 생각하는 듯했다. 그러나 필자가 실제로 제품과 AI 기술이 어떻게 관련됐는지 확인하자 상당수가 불편한 침묵으로 답을 대신하거나, 혹은 AI라기 보다는 룰 엔진(rules engines)에 더 가까운 기술을 AI인 것처럼 설명했다.

이처럼 AI 기술이 적용되지 않은 제품에 AI라는 용어를 사용하면 고객에게 혼란을 초래할 수 있다. 또한 진짜 AI 기술이 적용된 상품 및 서비스를 판매하는 업체에 피해를 주는 행위이기도 하다. 따라서 컴퓨터 보안 솔루션을 구매하려는 소비자나 기업이라면, AI 기술의 정확한 의미를 알아 두는 것이 도움이 될 것이다.

AI와 룰 기반 엔진, 어떻게 다른가
이는 젠엣지(Zenedge)의 CEO 유리 프레이먼, 공동 창립자이자 최고 상품 책임자 로렌 길과 인터뷰에서도 흥미롭게 논의된 주제였다. 사실 이 인터뷰는 예정된 날짜보다 수 주 가량 지연됐는데, 마침내 인터뷰를 진행할 당시에 젠엣지는 이미 오라클에 인수된 상태였다. 법적 절차가 진행중이어서 두 사람은 젠엣지나 젠엣지의 상품과 관련한 내용은 말할 수 없다고 했다.

그러나 젠엣지는 AI 기술을 적용한 컴퓨터 보안 솔루션 개발업체로 알려져 있었고, 두 사람 역시 가짜 AI 기술을 내세우는 업체들에 질려 있었던 터라 이 주제 만으로 30분 넘게 이야기할 수 있었다. 열띤 대화였다. 먼저 필자는 그들에게, 룰 기반 엔진(rule-based engine)과 AI의 가장 큰 차이점을 물었다. 왜냐하면 수백 가지 룰을 가진 업체가 이를 AI와 유사한 기술이라고 홍보하고 있기 때문이다.

이에 대해 로렌은 "룰 기반 엔진은 마치 시그니처 기반 안티바이러스와 같다. 무엇을 기대해야 할 지가 명확하다. 과거에 있었던 일을 분석하고, 이에 기반해 '만약 ~한다면, ~한다' 같은 식의 룰을 만들어 이미 알려진 악성코드를 식별해 낸다. 때문에 룰은 과거 경험에 기반하는 동시에 그것을 뛰어 넘지는 못한다. 해커 커뮤니티에서 벌이는 일들 중 우리에게 이미 알려진 것들만 대처할 수 있다. 그러나 해커가 자신의 전략을 미리 알려주는 일은 없으므로 결국 룰은 언제나 해커보다 한 발 늦은 사후 대책이 될 뿐이다"라고 말했다.

이어 "반면 AI는 더 미래 지향적 기술이다. 전례 없는 새로운 무언가에 맞닥뜨렸을 때, AI는 '이것이 무엇인지는 모르겠지만, 과거에 이와 유사한 것을 경험한 적이 있으므로 중요한 정보로 표기해 놓고 주시하겠다'는 식의 전략을 취한다. 또는 '이러한 현상은 과거에 한 번도 전례가 없는 변칙적인 것이므로 중요 정보로 표기해 놓고 주시하겠다'라고 할 수도 있다"라고 덧붙였다.

즉 룰은 '만일 ~이면 ~한다'처럼 과거 데이터에 기반한 조건부 의사 결정에 가깝다. 반면 AI는 전례 없는 사건이 발생했을 때 이를 인지할 수 있다. 지금까지 '잘 모르겠다, 전례가 없는 경우다'라는 이야기를 할 수 있는 건 사람뿐이었다. AI의 진정한 가치는 바로 이런 이야기를 사람처럼 할 수 있다는 것이다.

또한 로렌은 "AI와 룰 기반 엔진의 가장 중요한 차이점은 후자는 사람이 나서서 룰을 업데이트 해주지 않으면 언제까지나 처음 상태 그대로 머물러 있는 반면, 전자는 사용하면 할수록 스스로 사고의 정확도를 높여갈 수 있다는 것이다. AI를 많이 사용할수록 AI는 똑똑해 진다. 이러한 모형의 융통성이야 말로 AI의 진정한 강점이다"라고 말했다. 유리 역시 여기에 강하게 동의했다. "룰이란 기본적으로 과거에 기반해 만들어 진다. AI는 미래를 예상할 수 있다"라고 말했다.

그렇다면 업체가 정말 AI 기술을 사용하고 있는지 알아보려면 어떤 질문을 던져야 할까? 유리는 "만일 나라면 제로데이 공격 탐지 및 처리에 관해 물어볼 것이다. 제로 데이 공격은 히스토리가 없다. 예상하기 어려운 것에 대해 룰을 만들 수는 없다. 이 부분에 대해 물어 보면 과연 해당 업체의 솔루션이 룰 기반인지, AI 기반인지 확실히 알 수 있다"라고 말했다.


미래 해킹은 AI와 AI의 싸움
이어진 대화는 놀라우면서도 간담이 서늘해지는 것이었다. 유리는 "앞으로 해킹은 (그리고 해킹에 대한 방어는) 기계 대 기계의 싸움이 될 것이다. 마치 쥘 베른의 소설 속 이야기 같지만, 기업의 방어를 우회해 공격을 시도하는 해커는 이미 AI를 이용하고 있다. 이러한 공격에 효과적으로 대처하려면 우리도 똑같이 기계 학습과 AI 기술을 사용할 수 밖에 없다"라고 말했다.

로렌도 "좋은 봇이든 나쁜 봇이든, 봇은 이미 인간처럼 행동하는 AI를 이용하고 있다. 봇은 AI 기술을 이용해 무작위로 행위 패턴을 바꾸고, 탐지 시스템이나 방어막을 우회하기 때문에 이들에 맞서려면 우리도 AI 기술이 필요하다"라고 말했다.

이들의 지적은 놀라우면서도 충분히 이해할 수 밖에 없는 것이었다. 이들이 옳다. 미래 해킹 전쟁은 기계와 기계 간의 싸움이 될 것이다. 지금은 아닐지 몰라도, 머지 않은 미래에는 컴퓨터 세계에서 선과 악이 대립하는 일이 빈번하게 발생할 것이다.

'기계 vs. 기계'라는 개념은 룰 기반 세계에서는 이미 오래 전부터 적용됐다. 예를 들어 필자가 개인적으로 좋아하는 바이러스 토탈(VirusTotal)이라는 웹사이트가 있다. 가지고 있는 파일의 해시를 제출하면 다수의 안티바이러스 소프트웨어 프로그램이 이 파일을 스캔해 악성인지 판별해 준다. 안티바이러스 프로그램을 하나만 쓸 때는 놓치는 것이 있을 수 있지만, 10여 개가 넘는 프로그램이 스캔한다면 그런 일은 거의 발생하지 않는다. 이런 이유로 필자는 바이러스 토탈을 애용한다.

문제는 악성코드 제작자도 그렇다는 것이다. 악성코드는 제작자는 오랜 시간에 걸쳐 악성코드 제작 프로세스를 자동화 했고, 그 결과 바이러스 토탈의 스캐닝에서도 잡히지 않을 악성코드를 만들 수 있게 됐다. 이것이 가능한 이유는 어쩌다 바이러스 토탈의 스캐닝에 걸리는 악성코드가 나오면, 악성코드 스스로 업데이트해 추후에는 탐지를 피해갈 수 있도록 발전하기 때문이다. 룰 기반 엔진의 세계에서 기계 대 기계의 싸움은 이런 양상으로 펼쳐진다. AI 기반 세계에도 같은 개념을 적용할 수 있다. 이미 AI가 AI를 상대하기 시작했고, 머지 않아 온라인 세계에서 악성코드의 상대는 인간이 아닌 기계가 될 것이다.

그렇다고 영화에서처럼 각성한 스카이넷이 터미네이터를 보내 인간을 말살시키는 그런 일이 일어날 거라고는 생각하지 않는다. 단, 앞으로 온라인 세계에서는 지금까지와는 전혀 다른, 더 정교하고 복잡한 선과 악의 대결이 펼쳐질 것이라는 점은 분명하다. 이 전쟁에서 우리 자신을 지키려면 더 많은, 더 정교한 AI 기술이 필요하다.

현재도 룰이나 룰 기반 엔진을 가지고 AI라고 주장하는 업체가 너무 많다. 우리를 목표로 하는 악성 AI의 공격에 대응하기 위해 우리에게 필요한 것은 또 다른 AI이다. 진정한 AI 기술을 보유한 업체와 그렇지 않은 업체를 가려낼 수 있어야 하는 또 다른 이유다.

*Roger A. Grimes는 인포월드 테스트센터 전문 기고가로, 보안 전문 컨설턴트이자 마이크로소프트 수석 보안 아키텍트다. ciokr@idg.co.kr 
2018.03.02

칼럼 | 'AI를 가장한 룰 엔진' 여러분의 솔루션은 진짜 AI입니까?

Roger A. Grimes | CSO
클라우드, 패브릭, 비트코인, 블록체인, 컨테이너, 마이크로서비스 등 새로운 기술은 새로운 유행어를 만들어 낸다. 인공 지능(AI)이라는 기술 및 용어 역시 10년도 더 전부터 있었던 것이지만 유행어가 된 것은 최근이다.



그러나, 유감스럽게도 일부 업체는 실제적인 AI 기술이 없음에도 불구하고 유행한다는 이유로 아무 데나 AI라는 용어를 가져다 붙인다. 이들이 AI가 무엇인지 잘 모르는 것일 수도, 아니면 소비자가 마케팅 팀의 감언이설에 넘어간 것일 수도 있지만, 어느 쪽이든 구매자 입장에서는 AI가 아닌 것에 AI라는 용어를 쓰는 것은 아닌지 주의 깊게 살펴 봐야 한다.

필자는 최근 다양한 업체의 제품을 살펴 봤다. 이들 대부분은 상품 설명에 AI라는 단어가 들어가면 판매량을 늘릴 수 있다고 생각하는 듯했다. 그러나 필자가 실제로 제품과 AI 기술이 어떻게 관련됐는지 확인하자 상당수가 불편한 침묵으로 답을 대신하거나, 혹은 AI라기 보다는 룰 엔진(rules engines)에 더 가까운 기술을 AI인 것처럼 설명했다.

이처럼 AI 기술이 적용되지 않은 제품에 AI라는 용어를 사용하면 고객에게 혼란을 초래할 수 있다. 또한 진짜 AI 기술이 적용된 상품 및 서비스를 판매하는 업체에 피해를 주는 행위이기도 하다. 따라서 컴퓨터 보안 솔루션을 구매하려는 소비자나 기업이라면, AI 기술의 정확한 의미를 알아 두는 것이 도움이 될 것이다.

AI와 룰 기반 엔진, 어떻게 다른가
이는 젠엣지(Zenedge)의 CEO 유리 프레이먼, 공동 창립자이자 최고 상품 책임자 로렌 길과 인터뷰에서도 흥미롭게 논의된 주제였다. 사실 이 인터뷰는 예정된 날짜보다 수 주 가량 지연됐는데, 마침내 인터뷰를 진행할 당시에 젠엣지는 이미 오라클에 인수된 상태였다. 법적 절차가 진행중이어서 두 사람은 젠엣지나 젠엣지의 상품과 관련한 내용은 말할 수 없다고 했다.

그러나 젠엣지는 AI 기술을 적용한 컴퓨터 보안 솔루션 개발업체로 알려져 있었고, 두 사람 역시 가짜 AI 기술을 내세우는 업체들에 질려 있었던 터라 이 주제 만으로 30분 넘게 이야기할 수 있었다. 열띤 대화였다. 먼저 필자는 그들에게, 룰 기반 엔진(rule-based engine)과 AI의 가장 큰 차이점을 물었다. 왜냐하면 수백 가지 룰을 가진 업체가 이를 AI와 유사한 기술이라고 홍보하고 있기 때문이다.

이에 대해 로렌은 "룰 기반 엔진은 마치 시그니처 기반 안티바이러스와 같다. 무엇을 기대해야 할 지가 명확하다. 과거에 있었던 일을 분석하고, 이에 기반해 '만약 ~한다면, ~한다' 같은 식의 룰을 만들어 이미 알려진 악성코드를 식별해 낸다. 때문에 룰은 과거 경험에 기반하는 동시에 그것을 뛰어 넘지는 못한다. 해커 커뮤니티에서 벌이는 일들 중 우리에게 이미 알려진 것들만 대처할 수 있다. 그러나 해커가 자신의 전략을 미리 알려주는 일은 없으므로 결국 룰은 언제나 해커보다 한 발 늦은 사후 대책이 될 뿐이다"라고 말했다.

이어 "반면 AI는 더 미래 지향적 기술이다. 전례 없는 새로운 무언가에 맞닥뜨렸을 때, AI는 '이것이 무엇인지는 모르겠지만, 과거에 이와 유사한 것을 경험한 적이 있으므로 중요한 정보로 표기해 놓고 주시하겠다'는 식의 전략을 취한다. 또는 '이러한 현상은 과거에 한 번도 전례가 없는 변칙적인 것이므로 중요 정보로 표기해 놓고 주시하겠다'라고 할 수도 있다"라고 덧붙였다.

즉 룰은 '만일 ~이면 ~한다'처럼 과거 데이터에 기반한 조건부 의사 결정에 가깝다. 반면 AI는 전례 없는 사건이 발생했을 때 이를 인지할 수 있다. 지금까지 '잘 모르겠다, 전례가 없는 경우다'라는 이야기를 할 수 있는 건 사람뿐이었다. AI의 진정한 가치는 바로 이런 이야기를 사람처럼 할 수 있다는 것이다.

또한 로렌은 "AI와 룰 기반 엔진의 가장 중요한 차이점은 후자는 사람이 나서서 룰을 업데이트 해주지 않으면 언제까지나 처음 상태 그대로 머물러 있는 반면, 전자는 사용하면 할수록 스스로 사고의 정확도를 높여갈 수 있다는 것이다. AI를 많이 사용할수록 AI는 똑똑해 진다. 이러한 모형의 융통성이야 말로 AI의 진정한 강점이다"라고 말했다. 유리 역시 여기에 강하게 동의했다. "룰이란 기본적으로 과거에 기반해 만들어 진다. AI는 미래를 예상할 수 있다"라고 말했다.

그렇다면 업체가 정말 AI 기술을 사용하고 있는지 알아보려면 어떤 질문을 던져야 할까? 유리는 "만일 나라면 제로데이 공격 탐지 및 처리에 관해 물어볼 것이다. 제로 데이 공격은 히스토리가 없다. 예상하기 어려운 것에 대해 룰을 만들 수는 없다. 이 부분에 대해 물어 보면 과연 해당 업체의 솔루션이 룰 기반인지, AI 기반인지 확실히 알 수 있다"라고 말했다.


미래 해킹은 AI와 AI의 싸움
이어진 대화는 놀라우면서도 간담이 서늘해지는 것이었다. 유리는 "앞으로 해킹은 (그리고 해킹에 대한 방어는) 기계 대 기계의 싸움이 될 것이다. 마치 쥘 베른의 소설 속 이야기 같지만, 기업의 방어를 우회해 공격을 시도하는 해커는 이미 AI를 이용하고 있다. 이러한 공격에 효과적으로 대처하려면 우리도 똑같이 기계 학습과 AI 기술을 사용할 수 밖에 없다"라고 말했다.

로렌도 "좋은 봇이든 나쁜 봇이든, 봇은 이미 인간처럼 행동하는 AI를 이용하고 있다. 봇은 AI 기술을 이용해 무작위로 행위 패턴을 바꾸고, 탐지 시스템이나 방어막을 우회하기 때문에 이들에 맞서려면 우리도 AI 기술이 필요하다"라고 말했다.

이들의 지적은 놀라우면서도 충분히 이해할 수 밖에 없는 것이었다. 이들이 옳다. 미래 해킹 전쟁은 기계와 기계 간의 싸움이 될 것이다. 지금은 아닐지 몰라도, 머지 않은 미래에는 컴퓨터 세계에서 선과 악이 대립하는 일이 빈번하게 발생할 것이다.

'기계 vs. 기계'라는 개념은 룰 기반 세계에서는 이미 오래 전부터 적용됐다. 예를 들어 필자가 개인적으로 좋아하는 바이러스 토탈(VirusTotal)이라는 웹사이트가 있다. 가지고 있는 파일의 해시를 제출하면 다수의 안티바이러스 소프트웨어 프로그램이 이 파일을 스캔해 악성인지 판별해 준다. 안티바이러스 프로그램을 하나만 쓸 때는 놓치는 것이 있을 수 있지만, 10여 개가 넘는 프로그램이 스캔한다면 그런 일은 거의 발생하지 않는다. 이런 이유로 필자는 바이러스 토탈을 애용한다.

문제는 악성코드 제작자도 그렇다는 것이다. 악성코드는 제작자는 오랜 시간에 걸쳐 악성코드 제작 프로세스를 자동화 했고, 그 결과 바이러스 토탈의 스캐닝에서도 잡히지 않을 악성코드를 만들 수 있게 됐다. 이것이 가능한 이유는 어쩌다 바이러스 토탈의 스캐닝에 걸리는 악성코드가 나오면, 악성코드 스스로 업데이트해 추후에는 탐지를 피해갈 수 있도록 발전하기 때문이다. 룰 기반 엔진의 세계에서 기계 대 기계의 싸움은 이런 양상으로 펼쳐진다. AI 기반 세계에도 같은 개념을 적용할 수 있다. 이미 AI가 AI를 상대하기 시작했고, 머지 않아 온라인 세계에서 악성코드의 상대는 인간이 아닌 기계가 될 것이다.

그렇다고 영화에서처럼 각성한 스카이넷이 터미네이터를 보내 인간을 말살시키는 그런 일이 일어날 거라고는 생각하지 않는다. 단, 앞으로 온라인 세계에서는 지금까지와는 전혀 다른, 더 정교하고 복잡한 선과 악의 대결이 펼쳐질 것이라는 점은 분명하다. 이 전쟁에서 우리 자신을 지키려면 더 많은, 더 정교한 AI 기술이 필요하다.

현재도 룰이나 룰 기반 엔진을 가지고 AI라고 주장하는 업체가 너무 많다. 우리를 목표로 하는 악성 AI의 공격에 대응하기 위해 우리에게 필요한 것은 또 다른 AI이다. 진정한 AI 기술을 보유한 업체와 그렇지 않은 업체를 가려낼 수 있어야 하는 또 다른 이유다.

*Roger A. Grimes는 인포월드 테스트센터 전문 기고가로, 보안 전문 컨설턴트이자 마이크로소프트 수석 보안 아키텍트다. ciokr@idg.co.kr 
X