Offcanvas

AI / CSO / IoT / 머신러닝|딥러닝 / 보안 / 빅데이터 | 애널리틱스 / 악성코드 / 클라우드

'보안 AI, 거품이 있긴 하지만…' 해야 할 3가지 vs. 하지 말아야 2가지

2019.04.23 Paul Shomo  |  CSO


AI 혁명에서 데이터의 역할을 과소평가하지 말자
현재 사이버보안에 투입된 AI/ML은 사기 방지 및 군사용 애플리케이션에 30년 동안 사용되었으며 구글 등의 검색 엔진이 수십 년 동안 사용하고 있다. 새로운 수학으로 인해 AI가 유행하고 있다면 그 정체는 무엇일까?

클라우드로의 이전을 통해 저장 비용이 감소했다. 대규모 데이터 큐레이션, 훈련, 실행 알고리즘을 위한 처리 능력을 얻게 되었다. 또한 SaaS와 관리형 데이터의 출현으로 여러 고객사의 데이터가 단일 업체의 데이터스토어에 통합되었다. 그리고 이런 데이터가 풍부한 제공자들은 AI/ML을 통해 새로운 통찰을 제공할 유인을 얻게 되었다.

암호화된 데이터에 대한 프라이버시 보존 분석 및 AI를 제공하는 듀얼리티 테크놀로지스(Duality Technologies)의 공동 설립자 겸 CEO 앨런 카프만은 "불과 10년 또는 5년 만에 높은 품질의 데이터를 많이 보유하게 되었으며 복잡한 알고리즘을 실행할 연산 능력을 확보하게 되었다. 드디어 이런 오래된 알고리즘을 가져다가 대규모로 적용할 수 있게 된 것이다"라고 말했다.

그리고 데이터는 보안 전문가들이 악당들보다 나은 유일한 이점이다. 마이크로소프트의 CISO 브렛 아스널트는 "더 나은 감지를 위해 머신러닝과 인공지능 및 데이터를 활용하면서 동시에 최고의 데이터 신호를 통해 사람들에게 혜택을 제공한다는 점이 비대칭적이다. 상대방에 대해서는 비대칭적이다"라고 주장했다.

지난 4~5년 동안 업체들이 자체 데이터 과학자의 자격 증명과 통찰을 알고리즘에 적용하도록 압박하는 대신에 그들의 데이터에 대한 질문을 던졌어야 했다. 업체의 이상 감지 기술이 사용자의 환경을 학습하는가? 아니면 업체 데이터를 기준으로 훈련받는가? 업체 데이터를 기준으로 훈련받는다면 이런 데이터세트를 분석하여 자신의 네트워크를 대변하는지 확인해야 한다.

차세대 안티바이러스 소프트웨어를 훈련하기 위해 악성코드 파일 샘플을 얻기는 쉽지만 스타트업은 어떻게 짧은 실행 거동에 대한 훈련 세트를 구성할 수 있을까? 이런 질문을 던져야 한다.

유행이 아니더라도 쉽고 효율적으로 수행하자
AI/ML은 확실한 것이 아니다. 전통적인 소프트웨어 개발에는 요건을 작성하는 도메인 전문가와 문제를 해결하기 위해 도메인 로직을 이행하는 프로그래머가 참여했다. 전통적인 소프트웨어 프로젝트 초기에는 버그가 있거나 유려함이 부족하더라도 유용한 기능을 제공하는 소프트웨어를 개발할 가능성을 예측하기가 어렵지 않았다.

데이터 과학은 완전히 다르다. 최고의 인재를 보유하고 있고 모든 것을 제대로 해도 성공의 수준을 예측하기란 어렵다. 데이터가 모델링할 수 있는 패턴으로 통합되지 않을 수 있다. 상관관계가 곧 인과관계는 아니므로 무엇인가를 잘못 예측할 수 있다. 아니면 이미 사실임을 알고 있는 것에 관해 이야기할 수 있다. 카프만은 "놀라운 데이터 과학 프로젝트를 통해 숫자를 분석해 보면 결국 세계 인구의 49.5%는 남성이라는 등의 사소하고 관련성 없는 결과를 얻게 될 수 있다"라고 말했다.

안타깝게도 지난 수년 동안의 보편적인 업체 전략은 이미 규칙이나 기본적인 경험을 통해 수행한 것을 ML로 전환하여 유행을 따라는 수준이었다. 더 많은 돈을 투자해 같은 결과를 제공했을 가능성이 크다.

카프만은 "메커니즘을 알고 있으면 머신러닝을 수행하지 않고 쉽게 프로그래밍할 수 있다. 모를 때에는 머신러닝이 필요하다. 이것이야말로 효과적인 경험을 위한 매우 현명한 방법이다"라고 덧붙였다.

자기 자신을 죽이지 말고 데이터 과학자를 찾으라
사이버보안 부문의 실업률은 0이라는 말이 있다. 사이버보안 경험이 있는 박사 학위 소지 데이터 과학자는 차치하더라도 보안 분석가를 찾기도 어렵다. 그리넬은 "현재 모든 기업이 의무감에 데이터 과학자나 데이터 과학팀을 찾고 있다고 생각한다. 기업 군비 경쟁인 것이다"라고 언급했다.

다행히도 이 업계에서는 데이터를 시각화하고 모델링하기 위한 툴을 개발하여 AI/ML을 더욱더 많은 데이터 엔지니어와 ‘시민 데이터 과학자’에게 제공하기 위해 노력하고 있다. (솔직히 필자의 고용주 오픈텍스트는 ML 및 예측 분석 플랫폼을 개발한다.)

이런 툴을 사용하는 것 외에 보안 업계에서는 학계와 더욱 자주 협력해야 한다. 학계 연구원들은 놀랍도록 구하기 쉽다. 그들은 이미 직업과 급여가 있으므로 컨설턴트를 시간제로 쓰기보다 학계 연구원을 시간제로 고용하기가 더 쉽다. 숙제를 늦게 제출하여 교수들에게 혼났던 기억만 있을 수 있지만 학자들은 사실 협력하기가 꽤 쉽다. 어쨌든 그들은 시간을 들여 이제 막 고등학교를 졸업한 학생들에게 기술에 관해 설명한다.

결론
그리넬의 말처럼, 업체들은 "당장 필요하지 않거나 현시점에서는 보유하고 있지 않더라도 머신러닝에 관한 이야기를 만들어 내는 모습"을 목격했다.

이는 보안에 좋지 못하다.

대신 보안 업계에서는 이제 AI를 통해 사이버보안을 혁신할 수 있는 영역과 아직 노력을 기울이지 않아도 되는 영역을 구분해야 한다.

*Paul Shomo는 보안 및 포렌식, 네트워킹 및 스토리지 분야에서 15년 이상의 경력을 쌓은 소프트웨어 엔지니어로 최근 몇 년간 전략적 파트너십을 관리하며 M&A 활동에 조언하고 있다. ciokr@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.