2018.09.27

AIOps란? IT운영에의 적용 방법은?

Tom Macaulay | Computerworld UK
AIOps는 IT 운영 분야의 새로운 용어다. 날로 복잡해지는 여러 자산을 관리함에 있어 문제를 식별하고 해결하는데 시간과 노력을 절감시켜줄 수 있다. 가트너는 어떻게 하면 다양한 AI 기능을 적용하여 IT 업무의 난제에 대처할 수 있는지를 설명하기 위해 이 용어를 제시했다.

현재 여러 벤더가 AIOps 플랫폼을 생산 중이다. 이들 솔루션은 머신러닝 기술을 이용해 오류 경보를 줄이고 보다 정확한 예측 경보를 제공하여 운영 상의 가시성을 늘린다. 단 효과적 이려면 API를 통해 다른 애플리케이션들을 통합해 격리된 체계들에 걸쳐 상호작용하는 벤더 불문 분석 시스템(vendor-agnostic analytics systems)을 생성해야 한다.

전형적인 사용 사례는 모니터링 툴에서 나온 이벤트 스트림의 사후-프로세싱, IT 서비스 관리 툴과의 양-방향 상호작용, 통찰력을 실제로 실행할 수 있는 자동화 툴셋과의 통합 등이다.



AIOps 전략을 개발하는 방법

가트너는 AIOps를 단계별로 구현하도록 권장한다. 얼리 어답터들은 일반적으로 모니터링, 운영, 및 인프라 데이터에 머신러닝을 적용하는 것으로부터 시작하여, 딥 신경망을 이용한 서비스 및 지원 데스크 자동화 쪽으로 나아간다.

가트너의 연구 디렉터인 비브 발라는 AIOps로부터 혜택을 받을 수 있는 이용 사례를 규명한 후 니즈에 부합하는 툴과 벤더를 평가하도록 제안한다.

이번 달 초 무그소프트(Moogsoft) AI 심포지엄에서 발라는 “단계적 AIOps 접근법이 가장 성공적인 경향이 있다”고 말했다.

이어 그는 “우리가 발견한 것은 이벤트 데이터 및 구조적 데이터의 머신러닝이 가장 쉽게 성과를 낼 수 있는 분야라는 것이다. 이에 숙달되면, 이 기술을 도입하는 진입점으로 이를 이용할 수 있다”고 말했다.

그러면서 “2 단계에서 이는 서비스 데스크 자동화를 둘러싼 언어 지향 데이터, 신경망, 행동 분석으로 진화할 것이다. 내가 하는 말의 요지는 가장 쉽게 성과를 거둘 수 있는 분야를 공략한 후 그로부터 확장하라는 것이다”고 말했다.

그는 이 신기술을 이용하기 위해 인프라 및 운영 팀을 교육하고, 여러 부서의 아이디어를 공유하기 위해 전문 조직을 개설하고, 그 후 “소규모로 시작하여 신속히 움직이고 신속히 검증하라”고 권고한다.

그는 “설치했다고 일이 끝나는 것이 아니다. 이는 전략이다. 따라서 측정하고 진화시키는 것이다. 이전에 인지하지 못한 통찰이라 할 수 있는 새 이용 사례를 추구하는 것이다”고 말했다.

벤더의 관점
발라는 스플렁크의 IT 서비스 인텔리전스, 무그소프트 AIOps 등 기성의 AIOps 툴이 내부 솔루션보다 더 인기가 있다고 전하며, 이유는 일관성이 더 뛰어나고, 성과까지의 시간이 더 빠르기 때문이라고 분석했다.

무그소프트의 CEO 필 티는 컴퓨터월드UK에게 자사 소프트웨어가 IT운영의 변화하는 니즈에 대처한다고 말했다.

그는 “AIOps를 생성한 데에는 이유가 있다. 일들이 어떻게 실패하는지, 그리고 이때 무슨 일이 일어나는지를 직관적으로 예측할 수 있는 시점이 지났기 때문이다”고 말했다.

이어 그는 “규칙들을 구축하여 실패 조건을 수동으로 검색하는 것을 넘어서야 한다. 확보한 데이터를 이용해 실패 조건을 찾는데 쓰일 논리를 정의하기 시작해야 한다. 우리가 AIOps에 대해 이야기할 때 이는 기본적으로 머신러닝, 데이터 과학 및 AI 기법을 망라하여 가능해지는 운영을 말하는 것이다”라고 말했다.

무그소프트 AIOps 플랫폼은 목적 지향의 머신러닝 알고리즘을 IT시스템 전체에 걸쳐 적용하여 문제를 발견하고 교정한다. 티는 자사 플랫폼의 최대 장점이 인간이 예측할 수 없는 잠재적 실패를 발견하는 것이라고 강조했다.

그는 “엔지니어들이 고의로 실수를 하는 것이 아니다. IT의 복잡성이 너무 거대해서 인간의 마음이 이를 감당하고 단순 논리로 줄이는 것이 사실상 불가능하다”고 말했다.

예를 들어, 결제 처리 회사인 월드페이(Worldpay)는 무그소프트에 의존하여 이벤트를 실행 가능 상황들로 클러스터링하고 유망한 근본 원인을 규명함으로써 전통적인 모니터링 툴의 실패를 감소시켰다. 한편 다임러는 차량에서 생성된 증가하는 데이터로부터 필요한 정보를 고객 서비스 팀에게 전달하는데 이를 이용한다.

다임러의 진단 및 커넥티드 비클 데이터 팀의 IT 매니저인 루디거 슈미트는 “우리에게 있어 AIOps는 모니터링 툴에서 나오는 수천 개의 이벤트에 관해서가 아니라 진정으로 결정적인 이벤트에 대응하기 위한 솔루션이다”고 말했다.

AIOps의 미래
가트너는 2019년까지 세계 기업의 25%가 2 ~3가지 중요 IT업무를 지원하는 AIOps 플랫폼을 구현할 것이라고 예측했다.

티는 디바이스가 지능화되고, 시스템이 한층 복잡해지고, 데이터 볼륨이 증가하면서 AIOps의 이용이 자연스럽게 증가할 것이라고 전망했다.

그는 “자율 네트워크 단계에 도달할 수 있는 시점이 다가오고 있다. 미래의 자가 치유 네트워크라는 비전이다. 여기서는 일이 어떻게 실패할 수 있고 어떻게 잘못될 수 있는지에 관해 학습된 지식의 공유를 바탕으로 치유적 조치를 자동으로 취할 수 있다’고 말했다.

이어 그는 “심지어 서비스가 재개되는 시점에 관한, 그리고 그 사이에, 영향이 무엇이든지 이를 감당하기 위해 고객이 무엇을 할 수 있는지에 관한 깊은 통찰을 가지고 영향 받은 고객에게 자동으로 도달하는 지점까지 이를 수 있다. 나는 AI가 고객에게까지 도달할 것이라고 생각하고, AI가 디바이스로까지 다시 도달할 것이라고 생각한다”고 말했다. ciokr@idg.co.kr 
2018.09.27

AIOps란? IT운영에의 적용 방법은?

Tom Macaulay | Computerworld UK
AIOps는 IT 운영 분야의 새로운 용어다. 날로 복잡해지는 여러 자산을 관리함에 있어 문제를 식별하고 해결하는데 시간과 노력을 절감시켜줄 수 있다. 가트너는 어떻게 하면 다양한 AI 기능을 적용하여 IT 업무의 난제에 대처할 수 있는지를 설명하기 위해 이 용어를 제시했다.

현재 여러 벤더가 AIOps 플랫폼을 생산 중이다. 이들 솔루션은 머신러닝 기술을 이용해 오류 경보를 줄이고 보다 정확한 예측 경보를 제공하여 운영 상의 가시성을 늘린다. 단 효과적 이려면 API를 통해 다른 애플리케이션들을 통합해 격리된 체계들에 걸쳐 상호작용하는 벤더 불문 분석 시스템(vendor-agnostic analytics systems)을 생성해야 한다.

전형적인 사용 사례는 모니터링 툴에서 나온 이벤트 스트림의 사후-프로세싱, IT 서비스 관리 툴과의 양-방향 상호작용, 통찰력을 실제로 실행할 수 있는 자동화 툴셋과의 통합 등이다.



AIOps 전략을 개발하는 방법

가트너는 AIOps를 단계별로 구현하도록 권장한다. 얼리 어답터들은 일반적으로 모니터링, 운영, 및 인프라 데이터에 머신러닝을 적용하는 것으로부터 시작하여, 딥 신경망을 이용한 서비스 및 지원 데스크 자동화 쪽으로 나아간다.

가트너의 연구 디렉터인 비브 발라는 AIOps로부터 혜택을 받을 수 있는 이용 사례를 규명한 후 니즈에 부합하는 툴과 벤더를 평가하도록 제안한다.

이번 달 초 무그소프트(Moogsoft) AI 심포지엄에서 발라는 “단계적 AIOps 접근법이 가장 성공적인 경향이 있다”고 말했다.

이어 그는 “우리가 발견한 것은 이벤트 데이터 및 구조적 데이터의 머신러닝이 가장 쉽게 성과를 낼 수 있는 분야라는 것이다. 이에 숙달되면, 이 기술을 도입하는 진입점으로 이를 이용할 수 있다”고 말했다.

그러면서 “2 단계에서 이는 서비스 데스크 자동화를 둘러싼 언어 지향 데이터, 신경망, 행동 분석으로 진화할 것이다. 내가 하는 말의 요지는 가장 쉽게 성과를 거둘 수 있는 분야를 공략한 후 그로부터 확장하라는 것이다”고 말했다.

그는 이 신기술을 이용하기 위해 인프라 및 운영 팀을 교육하고, 여러 부서의 아이디어를 공유하기 위해 전문 조직을 개설하고, 그 후 “소규모로 시작하여 신속히 움직이고 신속히 검증하라”고 권고한다.

그는 “설치했다고 일이 끝나는 것이 아니다. 이는 전략이다. 따라서 측정하고 진화시키는 것이다. 이전에 인지하지 못한 통찰이라 할 수 있는 새 이용 사례를 추구하는 것이다”고 말했다.

벤더의 관점
발라는 스플렁크의 IT 서비스 인텔리전스, 무그소프트 AIOps 등 기성의 AIOps 툴이 내부 솔루션보다 더 인기가 있다고 전하며, 이유는 일관성이 더 뛰어나고, 성과까지의 시간이 더 빠르기 때문이라고 분석했다.

무그소프트의 CEO 필 티는 컴퓨터월드UK에게 자사 소프트웨어가 IT운영의 변화하는 니즈에 대처한다고 말했다.

그는 “AIOps를 생성한 데에는 이유가 있다. 일들이 어떻게 실패하는지, 그리고 이때 무슨 일이 일어나는지를 직관적으로 예측할 수 있는 시점이 지났기 때문이다”고 말했다.

이어 그는 “규칙들을 구축하여 실패 조건을 수동으로 검색하는 것을 넘어서야 한다. 확보한 데이터를 이용해 실패 조건을 찾는데 쓰일 논리를 정의하기 시작해야 한다. 우리가 AIOps에 대해 이야기할 때 이는 기본적으로 머신러닝, 데이터 과학 및 AI 기법을 망라하여 가능해지는 운영을 말하는 것이다”라고 말했다.

무그소프트 AIOps 플랫폼은 목적 지향의 머신러닝 알고리즘을 IT시스템 전체에 걸쳐 적용하여 문제를 발견하고 교정한다. 티는 자사 플랫폼의 최대 장점이 인간이 예측할 수 없는 잠재적 실패를 발견하는 것이라고 강조했다.

그는 “엔지니어들이 고의로 실수를 하는 것이 아니다. IT의 복잡성이 너무 거대해서 인간의 마음이 이를 감당하고 단순 논리로 줄이는 것이 사실상 불가능하다”고 말했다.

예를 들어, 결제 처리 회사인 월드페이(Worldpay)는 무그소프트에 의존하여 이벤트를 실행 가능 상황들로 클러스터링하고 유망한 근본 원인을 규명함으로써 전통적인 모니터링 툴의 실패를 감소시켰다. 한편 다임러는 차량에서 생성된 증가하는 데이터로부터 필요한 정보를 고객 서비스 팀에게 전달하는데 이를 이용한다.

다임러의 진단 및 커넥티드 비클 데이터 팀의 IT 매니저인 루디거 슈미트는 “우리에게 있어 AIOps는 모니터링 툴에서 나오는 수천 개의 이벤트에 관해서가 아니라 진정으로 결정적인 이벤트에 대응하기 위한 솔루션이다”고 말했다.

AIOps의 미래
가트너는 2019년까지 세계 기업의 25%가 2 ~3가지 중요 IT업무를 지원하는 AIOps 플랫폼을 구현할 것이라고 예측했다.

티는 디바이스가 지능화되고, 시스템이 한층 복잡해지고, 데이터 볼륨이 증가하면서 AIOps의 이용이 자연스럽게 증가할 것이라고 전망했다.

그는 “자율 네트워크 단계에 도달할 수 있는 시점이 다가오고 있다. 미래의 자가 치유 네트워크라는 비전이다. 여기서는 일이 어떻게 실패할 수 있고 어떻게 잘못될 수 있는지에 관해 학습된 지식의 공유를 바탕으로 치유적 조치를 자동으로 취할 수 있다’고 말했다.

이어 그는 “심지어 서비스가 재개되는 시점에 관한, 그리고 그 사이에, 영향이 무엇이든지 이를 감당하기 위해 고객이 무엇을 할 수 있는지에 관한 깊은 통찰을 가지고 영향 받은 고객에게 자동으로 도달하는 지점까지 이를 수 있다. 나는 AI가 고객에게까지 도달할 것이라고 생각하고, AI가 디바이스로까지 다시 도달할 것이라고 생각한다”고 말했다. ciokr@idg.co.kr 
X