2016.01.27

기고 | 보안에서 빅데이터 분석을 유용하게 활용하는 방법

Ron Bennatan | Network World
* 본 기고문은 벤더가 작성한 것으로 네트워크 월드 편집진의 수정을 거쳤다. 그러나 벤더의 시각이 일부 남아 있을 수 있다.


이미지 출처 : Thinkstock

최근 보안 애널리틱스 분야에서 빅데이터가 크게 유행하고 있다. 하지만 수년간 ‘데이터 레이크’를 구축하고도 쓸만한 결과를 얻기 위해 이 ‘데이터 레이크’를 활용할 수 없다는 사실만 알아낸 많은 회사들이 부지기수다. 때문에 구매자들은 보안 애널리틱스에 빅데이터를 활용하는데 회의적인 반응을 보이고 있다.

그리고 안타깝게도 지금 나와 있는 솔루션들에는 숫자 위주의 통계 보고서와 화려한 대시보드로 이뤄진 클러스터가 포함돼 있지만, 이런 것들은 유용성과 생산적인 보안 애널리틱스에 거의 도움이 되지 않는다. 실시간으로 의사결정을 내리고, 핵심 패턴을 발견하며, 보안 정책을 계속 밀고 나갈 지 아니면 바꿀 지를 결정하고, 보안을 크게 향상시키기 위해서는 쓸만한 데이터를 어떻게 이용할 지와 분석에 초점을 맞춰야 한다. 

속도(Velocity), 다양성(Verity), 용량(Volume)이라는 3Vs 특성을 가진 복잡한 데이터세트를 위해 빅데이터가 실시간 데이터 마이닝 기법을 성공적으로 구현시켜 줄 수 있는지를 확인하려면 구글, 아마존, 넷플릭스 같은 회사들만 보면 된다. 이 회사들은 우리가 무엇을 사거나 보고 싶어하는지를 말하는 예측적 애널리틱스와 함께 빅데이터를 자사 사업에서 핵심적인 도구로 활용하고 있다. 이들의 사례가 정말 유용한 보안 애널리틱스를 위한 모델이 돼야 한다.


이 기고문에서 소개하는 5가지 테스트는 보안에서 빅데이터를 어떻게 활용할 지 도움을 줄 것이다.
 
테스트 1: 당신이 선택한 빅데이터 솔루션이 3Vs에 대한 기능만 가지고 있나? 만약 공급 업체가 빅데이터의 속도, 다양성, 용량 문제만 해결한다면, 당신의 빅데이터 시스템은 SIEM(Security Information and Event management)보다는 효율적이겠지만 결국에는 빅데이터 스토리지 덫에 걸리게 될 것이다. 진짜 행동을 예측하는데 빅데이터가 유용하게 만들려면, 관련 업체는 베이즈 정리(Bayes’ theorem), 회귀, 분류 알고리즘, 차원수 문제 등에 대해 이야기해야 한다. 물론 그 모든 이야기가 달나라 과학처럼 답답하게 들릴 수도 있지만 보안 사고가 급격하게 증가하고 있음을 감안한다면, 이 같은 분석은 필수다.

테스트 2: “보안 애널리틱스가 무언인가?”라고 물을 때 공급 업체가 어떤 대답을 내놓나. 만약 그 대답으로 상관관계, 대시보드, 쿼리, 경보 등에 대해 듣게 된다면 그건 구식이다. 머신러닝 라이브러리, 큐브, 코사인 매트릭스 등에 대한 이야기를 들어야 한다. 모든 것들은 대수의 법칙/이상값에 기반해야 한다. 예를 들어 수집한 통계 데이터를 공유하고 보안 정책을 매뉴얼로 규정해야 하는 사용자와는 반대로, 공급 업체가 제시하는 기술은 수많은 데이터와 수많은 내역을 활용해 자동으로 무언가를 (그리고 지속적으로 더욱 정교하게) 구축하는 것이어야 한다.




2016.01.27

기고 | 보안에서 빅데이터 분석을 유용하게 활용하는 방법

Ron Bennatan | Network World
* 본 기고문은 벤더가 작성한 것으로 네트워크 월드 편집진의 수정을 거쳤다. 그러나 벤더의 시각이 일부 남아 있을 수 있다.


이미지 출처 : Thinkstock

최근 보안 애널리틱스 분야에서 빅데이터가 크게 유행하고 있다. 하지만 수년간 ‘데이터 레이크’를 구축하고도 쓸만한 결과를 얻기 위해 이 ‘데이터 레이크’를 활용할 수 없다는 사실만 알아낸 많은 회사들이 부지기수다. 때문에 구매자들은 보안 애널리틱스에 빅데이터를 활용하는데 회의적인 반응을 보이고 있다.

그리고 안타깝게도 지금 나와 있는 솔루션들에는 숫자 위주의 통계 보고서와 화려한 대시보드로 이뤄진 클러스터가 포함돼 있지만, 이런 것들은 유용성과 생산적인 보안 애널리틱스에 거의 도움이 되지 않는다. 실시간으로 의사결정을 내리고, 핵심 패턴을 발견하며, 보안 정책을 계속 밀고 나갈 지 아니면 바꿀 지를 결정하고, 보안을 크게 향상시키기 위해서는 쓸만한 데이터를 어떻게 이용할 지와 분석에 초점을 맞춰야 한다. 

속도(Velocity), 다양성(Verity), 용량(Volume)이라는 3Vs 특성을 가진 복잡한 데이터세트를 위해 빅데이터가 실시간 데이터 마이닝 기법을 성공적으로 구현시켜 줄 수 있는지를 확인하려면 구글, 아마존, 넷플릭스 같은 회사들만 보면 된다. 이 회사들은 우리가 무엇을 사거나 보고 싶어하는지를 말하는 예측적 애널리틱스와 함께 빅데이터를 자사 사업에서 핵심적인 도구로 활용하고 있다. 이들의 사례가 정말 유용한 보안 애널리틱스를 위한 모델이 돼야 한다.


이 기고문에서 소개하는 5가지 테스트는 보안에서 빅데이터를 어떻게 활용할 지 도움을 줄 것이다.
 
테스트 1: 당신이 선택한 빅데이터 솔루션이 3Vs에 대한 기능만 가지고 있나? 만약 공급 업체가 빅데이터의 속도, 다양성, 용량 문제만 해결한다면, 당신의 빅데이터 시스템은 SIEM(Security Information and Event management)보다는 효율적이겠지만 결국에는 빅데이터 스토리지 덫에 걸리게 될 것이다. 진짜 행동을 예측하는데 빅데이터가 유용하게 만들려면, 관련 업체는 베이즈 정리(Bayes’ theorem), 회귀, 분류 알고리즘, 차원수 문제 등에 대해 이야기해야 한다. 물론 그 모든 이야기가 달나라 과학처럼 답답하게 들릴 수도 있지만 보안 사고가 급격하게 증가하고 있음을 감안한다면, 이 같은 분석은 필수다.

테스트 2: “보안 애널리틱스가 무언인가?”라고 물을 때 공급 업체가 어떤 대답을 내놓나. 만약 그 대답으로 상관관계, 대시보드, 쿼리, 경보 등에 대해 듣게 된다면 그건 구식이다. 머신러닝 라이브러리, 큐브, 코사인 매트릭스 등에 대한 이야기를 들어야 한다. 모든 것들은 대수의 법칙/이상값에 기반해야 한다. 예를 들어 수집한 통계 데이터를 공유하고 보안 정책을 매뉴얼로 규정해야 하는 사용자와는 반대로, 공급 업체가 제시하는 기술은 수많은 데이터와 수많은 내역을 활용해 자동으로 무언가를 (그리고 지속적으로 더욱 정교하게) 구축하는 것이어야 한다.


X