리뷰 | 현존하는 최고의 네트워크 모니터링 시스템 ‘EM7’

InfoWorld
네트워크 모니터링은 많이 알면 알수록 그보다 더 많이 알아야 할 필요가 있다는 점에서 골치가 아프다. 그러자 몇몇 기업들은 이런 현실을 외면하면서 최소한의 일만 수행하고 무언가 잘못됐을 때 몰랐다고 변명하기 바쁘다. 또다른 기업들은 네트워크 업체가 이용해야 한다고 말한 것들만 제한적으로 사용한다.

따라서 필자는 단일 제조사에 묶이지 않으면서도 어려운 현실에 정면으로 맞설 수 있는 솔루션을 원했다. 동시에 자세히 살펴봐야되는 경고를 닥치는대로 있는 족족 보내지 않고 그 경고들을 맥락에 맞춰 보내주는 툴이 필요했다.
 
그 해답이 바로 사이언스로직(ScienceLogic)의 EM7이었다. EM7은 대형 시스템으로 확장할 수 있는 캐리어급(carrier-class) 모니터링 시스템이면서도 동시에 하와이대학교 해양지구과학기술연구소(SOEST) 같은 작은 네트워크에서 사용하기에도 적절하고 비용도 충분히 감당할만했다.
 
비록 필자와 IT 지원 그룹은 사이언스로직 EM7 시스템에 익숙해지는 데는 어느 정도 시간이 걸렸지만 멀티테넌트 환경을 구축할 수 있는 기능 덕분에 우리는 인력을 더 투입하는 대신 HPC 클러스터를 운영하는 개별 연구소에 모니터링 임무를 맡길 수 있게 됐다. 또한 EM7은 관리 정보 베이스(MIB)가 없는 장비에 대한 모니터링도 지원한다.
 
또한 여러 지점를 두고 있는 많은 기업들이 그렇듯 우리는 모든 지점마다 각각 세팅을 해야하는 상황을 피하면서도 방화벽과 WAN 링크 등을 통해 원격으로 모니터링할 수 있는 기능을 원했다.  이를 위해 필자는 EM7 수집기들을 물리적 어플라이언스나 가상화 기기를 통해 주요 지점에 배치했다. 수집된 데이터는 한번에 주 데이터베이스로 전송되기 때문에 지속적인  SNMP 트래픽으로 WAN 파이프를 과도하게 점유하지 않는다.
 
다른 많은 기업들처럼 업무들은 몇몇 직원들 사이에서 분배된다. EM7 대시보드 시스템은 상태 화면을 지원팀 모두가 이해할 수 있는 정보로 맞춤설정이 가능하다. 그래서 시스템 대시보드는 윈도우, 리눅스, 선(Sun) 기기에 집중하고 네트워킹 화면은 기간망과 분배 스위치에 집중해 직원 모두가 전체 시스템 상태을 한눈에 확인할 수 있다.

시스템에 더 적응해 가면서 우리는 특정 연구소에서 시스템의 주요 정보를 한번에 볼 수 있는 새로운 대시보드도 구상했다. 이를 통해 다른 연구소나 시스템 정보들을 모두 확인할 필요가 없어질 것이다.
 
필자가 처한 또다른 큰 어려움은 새로워진 가상화와 클라우드 환경을 파악하는 것이었다. 대부분의 소규모-기업-모니터링 시스템이 SNMP와 WMI 정보를 서버에서 불러올 수 있지만 우리는 VM웨어와 하이퍼-V(Hyper-V)에 대해 더 많이 알고 싶었다. 기존의 구형 모니터링 시스템은 이 정보를 제공하지 못했다. 반면 EM7 시스템은 가상화 호스트와 물리적 노드의 성능을 기능성과 조직 내의 역할 맥락에서 검사할 수 있는 기능을 지원한다.
 
 
대규모 네트워크용으로 구축되다
필자는 EM7이 워츠업 골드(WhatsUp Gold)나 다른 개별 기업용 네트워크 모니터링 시스템과 비교할 제품이 아니라는 것을 분명히 하고 싶다. 이것은 수백개 연결 네트워크와 수백개 기업들을 감당할 수 있는 충분한 유연성이 필요한 캐리어급 시스템으로 국가적 국제적 캐리어와 일하는 엔지니어들에 의해 개발된 것이다. EM7이 국가 기상 서비스 지도를 활용해 잠재적 문제 지역을 탐지해 낸다는 것은 사이언스로직이 얼마나 넓은 시스템 범위를 가지는 지를 짐작하게 한다.

그럼에도 불구하고 필자는 지난 일년 가량 EM7을 단일 대학, 단일 캠퍼스, 단일 연구소에서 이용해 왔다. 즉 가격은 모니터링하는 시스템의 수에 달려 있다. 
다시 말하면 EM7의 가격 구조는 1,000대의 기기가 있는 평면적 기업 네트워크와 자체 방화벽 뒤에 프로젝트가 있는 십여개의 연구소를 포함하는 우리 네트워크에 차이가 없다. 

이 모든 것들은 NAT 클래스 C IPv4 서브넷의 콜렉션에 들어가고 공공 어드레싱이 있는 몇몇과 적은 수는 IPv6로 전환한다. 만약 NAT 방화벽 뒤에 프로젝트가 있다면 시스템 정보를 주 EM7 데이터베이스에 피드하는 가상화 기기 수집기를, 단일 수집기를 가진 평면적 네트워크와 같은 가격으로 설치할 수 있다. 가상화가 아직 안됐다면 데이터베이스와 수집기 역시 물리적 기기들로 이용할 수 있다. 참고로 필자는 물리적 어플라이언스와 가상화 모두를 활용한다.
 
비록 EM7만의 자체적 규칙이 있지만 최초 셋업은 상당히 간단하다. 처음에는 완전히 새로운 용어들과 기능들을 어디서 찾아야 할지 혼란스러웠다. 결국 이 제품을 EM7이라고 명명한 것은 이 솔루션의 멀티테넌트 특성 때문으로 보인다.
 
예를 들어, '레지스트리'(registry)가 기기, 기기 그룹, 네트워크, 이용자, 그리고 보통 '애셋'(assets)이라 불리는 모든 것들을 담당하지만 멀티테넌트 요소가 여기 개입된다. 시스템이 알림, 스크립트, 케스케이딩 액션(cascading action)을 위해 실행하는 아이템 집합을 (액션 아이템(action item)이라 부르지않고) '런 북'(run Book)으로 부르는 것도 같은 원리다.

사이언스로직과 EM7 이용자 커뮤니티가 개발한 스크립트에 기반해 자동화가 일어나는 지점이 런 북이다. 필자는 SNMP가 명령을 통해 빨간색이나 파란색 빛으로 중요하거나 치명적인 경고를 표시해주는 파워 소켓을 켤 수 있는 인터롭넷 NOC(theInteropNet NOC) 자동화 스크립트를 매우 유용하게 사용하고 있다.
 
EM7의 커스터마이징 기능은 다른 제품 대비 큰 차별화 요소다. 시스템을 일 년간 사용한 후 인터롭 2011 팀은 시스템 로직 팀과 인터롭넷 팀 모두가 다양한 대시보드를 만들어냈다. 그 중에는 NOC의 거대한 55인치 모니터에 맞춰 네트워크 작업 팀이 여러 방에 분산된 다양한 장비 그룹을 모니터할 수 있는 것도 있다.

EM7 대시보드는 개인단위에서 커스터마이징할 수 있기 때문에 심지어 HTML5 대시보드를 만들어 팀원들이 아이패드 에서 주요 요소들을 관찰할 수도 있다. (EM7 대시보드는 현재 HTML5와 플래시의 혼합상태지만 사이언스로직은 점점 더 많은 위젯을 플래시에서 HTML5로 이전하고 있다)
 
EM7의 또다른 훌륭한 기능은 개인 대시보드와 함께 이용자 계정에 적합한 정보만을 표시하는 템플릿 기반 공유 대시보드를 함께 사용할 수 있다는 것이다. SOEST 연구 컴퓨팅 시설에서 각 연구 그룹은 자체 대시보드 세트를 가지고 장비를 모니터할 수 있고 동시에 전체 그룹은 네트워크 아키텍쳐 더 높은 곳의 주요 장비들을 모니터하는 학교 대시보드에 접속할 수 있다. 인터롭에서 우리는 무선, VoIP, 라우터 팀마다 고유의 대시보드 세트를 가지고 그들의 임무에 방해가 될 수 있는 상황 정보들은 피한 채 중요한 것들만 모니터할 수 있게 했다.
  

미국 대륙 전체에 퍼진 네트워크를 통해 인터롭넷은 태풍이 네트워크 성능에 영향을 미칠 가능성에 대해 모니터링할 수 있다.
 
늘어난 시그널, 줄어든 노이즈
EM7은 알림에 있어서도 세밀하게 제어할 수 있다. 인터롭넷을 셋업하려면 짧은 시간에 많은 수의 조각들을 모으는 일이 필요했다. 그 절차를 신속히 처리하기 위해 EM7 팀은 애셋을 발견한 후 구축 과정동안 네트워크의 일부분을 검사할 때 오류를 무시하기 위해 그것들을 유지 모드로 둔다. 한때 광섬유 팀이 쇼 인프라를 청소하고 더 많이 연결할수록 옵티컬 오류가 많이 있다는 것을 알았지만 우리는 경고와 깜빡이는 불빛에 방해받고 싶지 않았다.

EM7은 우리가 경고 설정을 바꾸도록 해줘 적은 수의 사소한 오류들은 무시하지만 그 사소한 오류들의 수가 단시간안에 증가하면 자동적으로 사소한 오류에서 중요한 오류, 마지막으로 치명적 오류까지 상태를 격상시킨다.
 
그 결과 우리는 라우터가 우리의 주요 WAN 링크 모두에 부하 밸런싱을 시작할 때까지 옵티컬 오류에 대한 알림을 받지 않았다. 사소한 오류들은 이차 링크상에 트래픽이 늘어남으로 인해 폭증하기 전까지는 무시된다. 이 격상된 경고는 우리의 주의를 끌고 놓친 옵티컬 패스 문제들을 찾도록 만든다. 누군가 오염된 광케이블을 꽂아서 몇몇 그릿(grit)을 10G 인터페이스 모듈에 몰아 넣었던 것으로 드러났다. 또한 이 격상된 경고는 전시관을 개장하기 전에 손상된 부품을 교체할 충분한 시간을 마련해 줬다.
 
EM7은 아주 많은 기능과 능력이 있어서 이를 정확히 설명하기 힘들 정도다. 설정은 쉽고 처음 학습 과정도 그리 힘들지 않다. 엄청난 확장성을 갖고 있으며 부하를 수많은 수집기, 물리적이나 가상화된 데이터베이스 어플라이언스에 걸쳐 분산할 수 있다.

추가할 수 있는 수집기의 수는 라이선스의 일부라서 제한이 없다. 원한다면 모든 서브넷마다 하나씩 두어도 된다. 무엇보다도 기기에 풀 MIB가 없다 하더라도 관리 시스템에서 기대할 수 있는 거의 모든것들을 하기 위해 EM7은 템플릿과 스크립팅까지 연장할 수 있다. 2년간 이 시스템을 운영하면서 직접 관리하지 못하는 것은 아무것도 없었다.
 
우리는 전체 대학교나 캠퍼스 단위가 아닌 각각의 연구실마다 자체적으로 모니터링하고 문제를 추적하도록 하기 위해 하와이대학 SOEST에 EM7을 선택했다. 그러나 멀티테넌트 관리와 빌링 능력, 그리고 놀랄만한 위임의 세분성으로 인해, 사이언스로직 EM7은 기업 시스템을 완벽하게 관리하는데 필요한 모든 것을 갖추고 있다. 이벤트를 엄청나게 다양한 플랫폼에 걸쳐 연관시키고 맥락에 따른 관점을 제공하며 자동적으로 문제를 추적해 시스템 멈춤 없이 유연하게 확장하는 EM7의 능력은 업계의 흐름을 바꿀만한 혁신적 제품이다. editor@idg.co.kr


 사이언스로직의 EM7 주요 특징과 장단점 요약