2019.06.07

클라우드 전환 직후가 '최적기'··· '중앙 모니터링'을 구축하는 방법

Isaac Sacolick | InfoWorld
클라우드에서 업무를 처리하고 애플리케이션을 안정적으로 실행하려면 먼저 거쳐야 할 몇 가지 중요한 단계가 있다. 그 가운데 하나가 애플리케이션과 데이터베이스, 서비스, 나아가 네트워크, 보안, 컴퓨팅, 스토리지를 아우르는 클라우드 인프라에 대한 총체적 모니터링 전략을 수립하는 것이다. 이를 통해 예상치 않은 문제에 대한 경고를 조기에 받을 수 있는데, 이는 용량, 비용, 장기적 안정성을 관리하는 데 결정적이다.
 
ⓒ Getty Images Bank

클라우드 마이그레이션 전략은 기업의 현재 상황과 요건에 따라 천차만별이지만, 모니터링, 특히 애플리케이션 모니터링에 대한 투자는 다음과 같은 경우에 특히 중요하다.

- 애플리케이션을 클라우드 인프라로 직접 이전하는 리프트-앤-시프트 경우. 모니터링은 예상치 않은 성능 문제를 알려줄 수 있다.
- 애플리케이션을 클라우드에서 실행하도록 재설계, 최적화하는 인-클라우드 트랜스포메이션 경우. 모니터링을 추가하면 새로운 이벤트 유형 및 예상치 않은 용량 문제에 대해 미리 경고를 받을 수 있다.
- 애플리케이션을 다중 클라우드에서 전개할 경우. 모니터링을 추가하면 레이턴시 문제에 대해 알림을 받을 수 있고, 이는 다수의 마이크로서비스에 걸쳐 복잡한 트랜잭션의 근본 원인을 찾는 데 유용하다.

클라우드 애플리케이션과 서비스 모니터링은 신규 툴 필요
그러나 안타깝게도 새로운 모니터링 기능을 추가하는 것은 그렇게 쉬운 일이 아니다. 클라우드로 이전하는 첫 단계에서 기업은 전면적으로 새로운 모니터링 툴과 알림 유형을 검토해야 한다. 실제로 데이터센터에 이미 투자를 했다면 가상화 시스템과 프라이빗 클라우드용 온-프레미스 툴이 퍼블릭 클라우드 애플리케이션, 서비스, 서버리스 컴퓨팅에서 그만큼 원활하게 작동하지 않음을 발견했을 것이다. 심지어 기업이 멀티 클라우드 전략을 도입할 때조차 기업은 각 클라우드 사업자의 빌트-인 모니터링 기능을 이용하는 것을 선호한다. 이는 기본적으로 클라우드 마이그레이션 시 새 모니터링 툴을 도입한다는 의미다.

클라우드 마이그레이션에 따른 또 다른 요소는 흔히 모니터링 툴을 구성하고 경보에 대응하는 데 있어서 새로운 인력이 필요하다는 점이다. 예를 들어, 새로운 클라우드 네이티브 애플리케이션에는 개발자, 데브옵스 엔지니어, 비즈니스 소유자가 있을 것이고, 이들은 무엇을 모니터링하고 누구에서 알림을 보내야 하는지 잘 아는 주제 전문가다. 이런 상황에서 새 구성원이 추가되면 기존과 다른 워크플로우 툴을 사용할 수 있다. 즉 새 클라우드 전문팀은 지라(Jira)슬랙을 사용할 수 있는 것이다. 반면 기존 데이터센터팀은 서비스나우기업용 스카이프를 선호할 수 있다.

요지는 모니터링을 추가해야 할 매우 타당한 이유가 있다고 해도 결국 이는 새로운 복잡성을 초래한다는 점이다. 이는 클라우드 마이그레이션 또는 다중 클라우드 전략의 일환으로 중앙화된 모니터링 전략을 이행해 최소화할 수 있다.

중앙화된 모니터링 전략 구현 방법
중앙 모니터링 솔루션의 요구와 기능을 이해하는 가장 좋은 방법은 과거에 모니터링 툴이 어떻게 전개, 구성됐는지 검토하는 것이다. 대다수 IT 운영팀은 내지오스(Nagios), 퍼프몬(Perfmon) 등 기본 모니터링 툴이나 솔라윈드(SolarWinds), 왓스업 골드(Whatup Gold), 오프매니저(OpManager) 등의 플랫폼으로 시작해 네트워크와 인프라를 관리했다. 이는 그동안 운영팀이 인프라 문제에 대응하는 데는 강점이 있지만, 최종 사용자, 애플리케이션, 데이터베이스 성능 문제에 대응하는 데에는 취약했던 이유다.

인프라 모니터링 툴 외에도 운영팀은 필요할 때마다 모니터링 툴을 추가해 왔다. 어떤 경우 불안정한 데이터베이스의 용량 및 성능 문제를 모니터링하는 등 일련의 반복적인 문제에 대응해 툴을 추가했다. 또 다른 경우, 모니터링은 새로운 인프라를 추가할 때 딸려 왔다. 예컨대 새로운 데이터센터, 네트워크, 엔터프라이즈 시스템, 스토리지 디바이스 등이다. 클라우드 인프라를 추가하는 것은 두 번째 범주에 속한다.

새 모니터링 툴이 추가될 때 이 툴을 구성하도록 배정된 엔지니어는 보고와 경보가 자신의 팀으로 직접 발송되도록 하는 것이 보통이다. 이는 보고 및 경보를 신속히 설정하는 가장 쉬운 방법일 수 있다. 그러나 장기적으로 이는 정보로의 격리된 접근을 낳고, 아울러 다른 팀이 상이한 툴로부터 경보를 받는 문제를 발생시킨다.

따라서 더 좋은 방법은 모니터링을 중앙화하는 것이다. 일반적으로 각 모니터링 솔루션은 독자적으로 데이터를 수집하고, 문제를 진단해 보고서를 만든다. 그러나 이런 모니터링 데이터를 중앙 모니터에 취합하면 더 넓은 데이터 범위에 걸쳐 여러 기능을 수행할 수 있다. 중앙화는 기업에 다음과 같은 혜택을 제공한다.

- 다수의 모니터링 툴에서 이벤트를 논리적으로 범주화할 수 있다. 이를 통해 여러 모니터링 툴의 알림을 여러 팀에 무차별 전송하지 않는다. 대신 알림은 이벤트로 논리적으로 취합되고, 더 넓은 데이터 세트를 이용해 분석한 후 대응을 위해 적합한 팀으로 지능적으로 발송된다.
- 하나의 중앙 시스템을 이용하면 장기간에 걸쳐 변화하는 추세를 분석할 수 있고, 이를 통해 용량, 보안, 애플리케이션 이용성의 문제를 해결할 수 있다.
- 워크플로우 툴과의 통합은 1대 1 통합 대신 중앙화된 모니터링 툴을 통해 더 효율적으로 구현할 수 있다.

인텔리전스는 데이터의 중앙화와 워크플로우 툴과의 통합을 통해 비로소 가능해진다. 자동 운영을 구현하고, 오픈 박스 머신 러닝을 통해 관리 가능한 이벤트로 알림을 지능적으로 그룹화할 때 기업은 여러 혜택을 누릴 수 있다.
 
클라우드 이전은 중앙 모니터링을 구현할 최적 시점
중앙 모니터링 솔루션을 구축할 최적의 시기는 애플리케이션과 서비스를 클라우드로 이전할 때다. 단 인프라, 애플리케이션, 서비스 수준에서 모니터링을 구성하는 과정은 여전히 필요하다. 그러나 솔루션을 점증적으로 강화하는 대신, 모니터링 데이터와 알림을 중앙의 시스템으로 통합하는 단계를 거치는 것이 좋다. 이는 개별 모니터링 툴에서 점진적 강화를 구현하는 대신 중앙 툴로 작업을 이전하는 효과가 있다. 결과적으로 IT 운영팀이 약간의 노력만 추가하면 중앙화의 다양한 혜택을 누릴 수 있다.

그러나 중앙 모니터링을 구현하는 접근법 역시 중요하고, 여기에는 몇 가지 전략이 있다. 자체적으로 데이터 레이크 및 보고 툴을 만들면 최대의 유연성을 얻을 수 있지만, 이는 데이터 레이크나 웨어하우스의 개발, 보고서 구축, 알림 설정, 워크플로우 툴과의 통합 등 많은 투자가 필요하다. 빅팬더(BigPanda) 같은 업체는 빌트-인 통합, 머신 러닝, 자동 운영, 통합 애널리틱스 등을 포함한 중앙 모니터링 툴을 제공한다.

중앙 모니터링은 특히 머신 러닝이 다수의 알림과 하나의 이벤트를 적절히 연결해 근본적 원인을 더 쉽고 간편하게 식별할 수 있을 때 가장 위력적이다. 필자가 클라우드 마이그레이션 시 중앙 모니터링을 높이 평가하는 것도 이 때문이다. 이는 풍부한 모니터링을 제공해 새로운 인프라 성능을 개선하는 데 따른 위험을 상쇄한다. 더구나 다수의 모니터링 툴에서 알림을 설정하는 것보다 더 효율적으로 구축할 수 있는 장점도 있다. ciokr@idg.co.kr



2019.06.07

클라우드 전환 직후가 '최적기'··· '중앙 모니터링'을 구축하는 방법

Isaac Sacolick | InfoWorld
클라우드에서 업무를 처리하고 애플리케이션을 안정적으로 실행하려면 먼저 거쳐야 할 몇 가지 중요한 단계가 있다. 그 가운데 하나가 애플리케이션과 데이터베이스, 서비스, 나아가 네트워크, 보안, 컴퓨팅, 스토리지를 아우르는 클라우드 인프라에 대한 총체적 모니터링 전략을 수립하는 것이다. 이를 통해 예상치 않은 문제에 대한 경고를 조기에 받을 수 있는데, 이는 용량, 비용, 장기적 안정성을 관리하는 데 결정적이다.
 
ⓒ Getty Images Bank

클라우드 마이그레이션 전략은 기업의 현재 상황과 요건에 따라 천차만별이지만, 모니터링, 특히 애플리케이션 모니터링에 대한 투자는 다음과 같은 경우에 특히 중요하다.

- 애플리케이션을 클라우드 인프라로 직접 이전하는 리프트-앤-시프트 경우. 모니터링은 예상치 않은 성능 문제를 알려줄 수 있다.
- 애플리케이션을 클라우드에서 실행하도록 재설계, 최적화하는 인-클라우드 트랜스포메이션 경우. 모니터링을 추가하면 새로운 이벤트 유형 및 예상치 않은 용량 문제에 대해 미리 경고를 받을 수 있다.
- 애플리케이션을 다중 클라우드에서 전개할 경우. 모니터링을 추가하면 레이턴시 문제에 대해 알림을 받을 수 있고, 이는 다수의 마이크로서비스에 걸쳐 복잡한 트랜잭션의 근본 원인을 찾는 데 유용하다.

클라우드 애플리케이션과 서비스 모니터링은 신규 툴 필요
그러나 안타깝게도 새로운 모니터링 기능을 추가하는 것은 그렇게 쉬운 일이 아니다. 클라우드로 이전하는 첫 단계에서 기업은 전면적으로 새로운 모니터링 툴과 알림 유형을 검토해야 한다. 실제로 데이터센터에 이미 투자를 했다면 가상화 시스템과 프라이빗 클라우드용 온-프레미스 툴이 퍼블릭 클라우드 애플리케이션, 서비스, 서버리스 컴퓨팅에서 그만큼 원활하게 작동하지 않음을 발견했을 것이다. 심지어 기업이 멀티 클라우드 전략을 도입할 때조차 기업은 각 클라우드 사업자의 빌트-인 모니터링 기능을 이용하는 것을 선호한다. 이는 기본적으로 클라우드 마이그레이션 시 새 모니터링 툴을 도입한다는 의미다.

클라우드 마이그레이션에 따른 또 다른 요소는 흔히 모니터링 툴을 구성하고 경보에 대응하는 데 있어서 새로운 인력이 필요하다는 점이다. 예를 들어, 새로운 클라우드 네이티브 애플리케이션에는 개발자, 데브옵스 엔지니어, 비즈니스 소유자가 있을 것이고, 이들은 무엇을 모니터링하고 누구에서 알림을 보내야 하는지 잘 아는 주제 전문가다. 이런 상황에서 새 구성원이 추가되면 기존과 다른 워크플로우 툴을 사용할 수 있다. 즉 새 클라우드 전문팀은 지라(Jira)슬랙을 사용할 수 있는 것이다. 반면 기존 데이터센터팀은 서비스나우기업용 스카이프를 선호할 수 있다.

요지는 모니터링을 추가해야 할 매우 타당한 이유가 있다고 해도 결국 이는 새로운 복잡성을 초래한다는 점이다. 이는 클라우드 마이그레이션 또는 다중 클라우드 전략의 일환으로 중앙화된 모니터링 전략을 이행해 최소화할 수 있다.

중앙화된 모니터링 전략 구현 방법
중앙 모니터링 솔루션의 요구와 기능을 이해하는 가장 좋은 방법은 과거에 모니터링 툴이 어떻게 전개, 구성됐는지 검토하는 것이다. 대다수 IT 운영팀은 내지오스(Nagios), 퍼프몬(Perfmon) 등 기본 모니터링 툴이나 솔라윈드(SolarWinds), 왓스업 골드(Whatup Gold), 오프매니저(OpManager) 등의 플랫폼으로 시작해 네트워크와 인프라를 관리했다. 이는 그동안 운영팀이 인프라 문제에 대응하는 데는 강점이 있지만, 최종 사용자, 애플리케이션, 데이터베이스 성능 문제에 대응하는 데에는 취약했던 이유다.

인프라 모니터링 툴 외에도 운영팀은 필요할 때마다 모니터링 툴을 추가해 왔다. 어떤 경우 불안정한 데이터베이스의 용량 및 성능 문제를 모니터링하는 등 일련의 반복적인 문제에 대응해 툴을 추가했다. 또 다른 경우, 모니터링은 새로운 인프라를 추가할 때 딸려 왔다. 예컨대 새로운 데이터센터, 네트워크, 엔터프라이즈 시스템, 스토리지 디바이스 등이다. 클라우드 인프라를 추가하는 것은 두 번째 범주에 속한다.

새 모니터링 툴이 추가될 때 이 툴을 구성하도록 배정된 엔지니어는 보고와 경보가 자신의 팀으로 직접 발송되도록 하는 것이 보통이다. 이는 보고 및 경보를 신속히 설정하는 가장 쉬운 방법일 수 있다. 그러나 장기적으로 이는 정보로의 격리된 접근을 낳고, 아울러 다른 팀이 상이한 툴로부터 경보를 받는 문제를 발생시킨다.

따라서 더 좋은 방법은 모니터링을 중앙화하는 것이다. 일반적으로 각 모니터링 솔루션은 독자적으로 데이터를 수집하고, 문제를 진단해 보고서를 만든다. 그러나 이런 모니터링 데이터를 중앙 모니터에 취합하면 더 넓은 데이터 범위에 걸쳐 여러 기능을 수행할 수 있다. 중앙화는 기업에 다음과 같은 혜택을 제공한다.

- 다수의 모니터링 툴에서 이벤트를 논리적으로 범주화할 수 있다. 이를 통해 여러 모니터링 툴의 알림을 여러 팀에 무차별 전송하지 않는다. 대신 알림은 이벤트로 논리적으로 취합되고, 더 넓은 데이터 세트를 이용해 분석한 후 대응을 위해 적합한 팀으로 지능적으로 발송된다.
- 하나의 중앙 시스템을 이용하면 장기간에 걸쳐 변화하는 추세를 분석할 수 있고, 이를 통해 용량, 보안, 애플리케이션 이용성의 문제를 해결할 수 있다.
- 워크플로우 툴과의 통합은 1대 1 통합 대신 중앙화된 모니터링 툴을 통해 더 효율적으로 구현할 수 있다.

인텔리전스는 데이터의 중앙화와 워크플로우 툴과의 통합을 통해 비로소 가능해진다. 자동 운영을 구현하고, 오픈 박스 머신 러닝을 통해 관리 가능한 이벤트로 알림을 지능적으로 그룹화할 때 기업은 여러 혜택을 누릴 수 있다.
 
클라우드 이전은 중앙 모니터링을 구현할 최적 시점
중앙 모니터링 솔루션을 구축할 최적의 시기는 애플리케이션과 서비스를 클라우드로 이전할 때다. 단 인프라, 애플리케이션, 서비스 수준에서 모니터링을 구성하는 과정은 여전히 필요하다. 그러나 솔루션을 점증적으로 강화하는 대신, 모니터링 데이터와 알림을 중앙의 시스템으로 통합하는 단계를 거치는 것이 좋다. 이는 개별 모니터링 툴에서 점진적 강화를 구현하는 대신 중앙 툴로 작업을 이전하는 효과가 있다. 결과적으로 IT 운영팀이 약간의 노력만 추가하면 중앙화의 다양한 혜택을 누릴 수 있다.

그러나 중앙 모니터링을 구현하는 접근법 역시 중요하고, 여기에는 몇 가지 전략이 있다. 자체적으로 데이터 레이크 및 보고 툴을 만들면 최대의 유연성을 얻을 수 있지만, 이는 데이터 레이크나 웨어하우스의 개발, 보고서 구축, 알림 설정, 워크플로우 툴과의 통합 등 많은 투자가 필요하다. 빅팬더(BigPanda) 같은 업체는 빌트-인 통합, 머신 러닝, 자동 운영, 통합 애널리틱스 등을 포함한 중앙 모니터링 툴을 제공한다.

중앙 모니터링은 특히 머신 러닝이 다수의 알림과 하나의 이벤트를 적절히 연결해 근본적 원인을 더 쉽고 간편하게 식별할 수 있을 때 가장 위력적이다. 필자가 클라우드 마이그레이션 시 중앙 모니터링을 높이 평가하는 것도 이 때문이다. 이는 풍부한 모니터링을 제공해 새로운 인프라 성능을 개선하는 데 따른 위험을 상쇄한다. 더구나 다수의 모니터링 툴에서 알림을 설정하는 것보다 더 효율적으로 구축할 수 있는 장점도 있다. ciokr@idg.co.kr

X