2017.07.06

낙뢰 피해 IT 시스템도 수 분 만에 복구한 'DRaaS'

Ann Bednarz | Network World
스티브 워너가 '밀하우스(Milhaus)'에 합류한 2015년 당시 이 기업은 본격적으로 성장하는 시기였다. 당시 80명이었던 직원은 현재 270명까지 늘어났다. 그의 가장 중요한 업무도 기업의 IT 인프라를 새로운 기업 환경에 맞춰 업그레이드하는 것이었다.



밀하우스는 미국 인디애나폴리스에 본사를 둔 도시형 고급 아파트 설계, 건설, 관리 업체다. 워너는 이 기업의 첫 기술 총괄 임원이다. 그는 "단기간에 아주 작은 기업에서 중견 기업으로 성장했지만 IT 시스템과 백업 체계는 여전히 소기업에 맞게 머물러 있었다. 예를 들어 공조 장치도 없는 구형 서버를 사용했고, 새로 증설한 장비는 관리할 수 없는 정도였다. IT 인프라 전체가 무너지기 직전이었다"라고 말했다.

이에 따라 밀하우스는 지난해 본사를 옮기면서 서버실을 새로 구축했다. IT 인프라스트럭처도 완전히 새로 설계했다. IT 인프라 재정비의 하나로, 워너는 통신과 파일, 회계 서비스에 대해 강력한 보호 체계를 구축했다. 기존에는 파일 수준에서 클라우드로 백업했을 뿐 서버에 대한 복구 체계는 없었다. 그는 "만약 서버에 장애가 발생하면 며칠에 걸쳐 서버를 처음부터 다시 설정해야 하는 상황이었다. 제대로 된 재해복구 체계가 필요했다"라고 말했다.

당시 밀하우스에 가장 시급한 것은 커진 사업을 감당할 수 있고 더 많은 직원을 지원할 수 있는 인프라를 만드는 것이었다. 그리고 두 번째로 시급한 것이 재해복구, 즉 현실적인 백업 체계였다. 여기서 '현실적'이란 시스템을 처음부터 다시 만들지 않으면서도 안정적으로 재해복구를 지원해야 한다는 의미였다.

특히 밀하우스의 업무 시스템 중 가장 중요한 것은 전화 시스템이었다. 고급 아파트 거주자와 입주 예정자를 위한 핵심 서비스이면서 동시에 영업과 직원 지원에도 가장 일반적으로 사용하는 것이 전화였다. 더구나 밀하우스는 아파트를 설계하고 짓는 것 외에 관리 서비스까지 제공한다. 현재 12개 아파트에 전화 서비스를 제공하고 있다. 워너는 "이들 건물에서 언제든 전화를 사용할 수 있도록 관리하는 것이 IT 팀의 중요 업무다"라고 말했다.

이들 고급 아파트에 대한 네트워크 서비스는 더 다양해지고 있다. 고속 인터넷과 와이파이, TV, 홈 오토메이션 서비스 등이 대표적이다. 워너는 "우리는 이러한 서비스를 제공하기 위해 건물 전체에 자체 네트워크를 구축했다. 우리가 인터넷 회선을 대량으로 사들여 각 가정에 분배하는 방식이다. 일단 우리 건물로 이사를 오면 당일부터 광섬유 기반 고속 인터넷을 사용할 수 있다"라고 말했다.

밀하우스가 이들 서비스를 안정적으로 지원하고 재해에 대비하기 위해 주목한 것은 서비스로서 재해복구(DRaaS)였다. 유연성과 가격경쟁력, 전문가 지원 서비스 덕분에 최근 중소기업을 중심으로 도입 비율이 계속 높아지고 있다. 시장조사업체 포레스터 자료를 보면, 기업의 40%가 기업용 DRaaS를 도입했고 24%는 도입을 계획하고 있다.

밀하우스는 다양한 DRaaS 업체를 검토한 끝에 온라인 테크(Online Tech)를 선택했다. 하이브리드 클라우드와 코로케이션, 재해복구, 오프사이트 백업 서비스 등을 제공하는 업체다. 온라인 테크는 현재 자체 데이터센터에서 밀하우스에 파일 수준 백업과 이미지 백업을 DRaaS로 지원하고 있다.

밀하우스가 이 업체를 선택한 이유 중 하나는 원격지 백업과 재해복구를 지원한다는 점이다. 온라인 테크는 미국 내 3개 주에 걸쳐 총 7개 데이터센터를 운영하고 있다. 다양한 하이퍼바이저에 대한 페일오버와 페일백을 지원하는 것도 중요한 이유였다. 현재 밀하우스는 하이퍼-V로 표준화된 가상화 환경을 운영하고 있는데, 온라인 테크는 젤토(Zerto)의 가상화 복제 기술을 이용해 VM웨어와 마이크로소프트 하이퍼바이저 간에 복제를 지원한다. 여러 지역에 걸친 네이티브 멀티 테넌트도 가능하다.

밀하우스는 온라인 테크를 파트너로 선택한 이후 모든 데이터를 업체의 미시간 데이터센터로 이전, 복제했다. 젤토 솔루션을 이용했고 전체 작업을 마치는 데 한 달 이상 걸렸다. 워너는 "일부 문제가 있었지만 젤토 엔지니어와 함께 해법을 찾았다"라고 말했다.


이런 작업을 마친 후 지난해 12월 밀하우스는 새 재해복구 환경에 대한 첫 테스트를 했다. 워너는 "처음에는 이런 식으로는 절대 정상 작동하지 않을 것으로 생각했다. 그러나 문자 그대로 클릭 몇 번으로 서버가 생성됐고 로그인할 수 있었다. 가상머신을 전환하는 것만큼이나 빠르게 하이퍼바이저에서 작업이 수행됐다"라고 말했다.

이때는 단순한 테스트였지만, 밀하우스는 몇 달 후에는 실제 재해 상황에 직면했다. 아파트 옆에 통신탑이 있었는데 이곳이 낙뢰를 맞은 것이다. 워너는 "현장에 가보니 낙뢰로 통신탑이 땅으로 떨어지면서 지상의 통신 케이블 등을 파손한 상태였다. 서버실 내의 모든 스위치에서 장애가 발생하는 등 꽤 큰 네트워크 재해였다"라고 말했다.

통신과 전력 관련 기술자들이 장비를 복구, 교체할 수 있는지 확인하는 동안 워너는 온라인 테크에 연락을 취했다. 당시 장애가 계속됐다면 추가로 작업해야 할 것이 상당히 많았기 때문이다. 그러나 업체와 함께 젤토 기반의 업무 포탈에서 재해복구 작업을 시작하자, 테스트 때 작동했던 그대로 불과 몇 분 만에 모든 서버가 다시 나타났다.

그는 "모든 시스템이 제대로 백업되고 있었고 실제 재해 상황에서 이 시스템에 기대했던 대로 잘 작동했다. VoIP 전화 서비스 등 핵심 서비스의 장애 없이 재해 상황을 복구할 수 있었다"라고 말했다.

워너는 앞으로 핵심 서비스 일부를 추가로 고가용성 클라우드 환경으로 이전할 예정이다. 그는 "낙뢰는 물론 이와 비슷한 재해로부터 시스템을 보호하고 신뢰성을 높이기 위해 온라인 테크와 협력을 강화할 것이다. 핵심 서비스를 업체의 클라우드로 옮기는 것도 검토하고 있다. 이렇게 되면 온라인 테크가 직접 두 데이터센터 간에 복제해 시스템 장애에 대한 대비를 더 강화할 수 있다"라고 말했다. ciokr@idg.co.kr 



2017.07.06

낙뢰 피해 IT 시스템도 수 분 만에 복구한 'DRaaS'

Ann Bednarz | Network World
스티브 워너가 '밀하우스(Milhaus)'에 합류한 2015년 당시 이 기업은 본격적으로 성장하는 시기였다. 당시 80명이었던 직원은 현재 270명까지 늘어났다. 그의 가장 중요한 업무도 기업의 IT 인프라를 새로운 기업 환경에 맞춰 업그레이드하는 것이었다.



밀하우스는 미국 인디애나폴리스에 본사를 둔 도시형 고급 아파트 설계, 건설, 관리 업체다. 워너는 이 기업의 첫 기술 총괄 임원이다. 그는 "단기간에 아주 작은 기업에서 중견 기업으로 성장했지만 IT 시스템과 백업 체계는 여전히 소기업에 맞게 머물러 있었다. 예를 들어 공조 장치도 없는 구형 서버를 사용했고, 새로 증설한 장비는 관리할 수 없는 정도였다. IT 인프라 전체가 무너지기 직전이었다"라고 말했다.

이에 따라 밀하우스는 지난해 본사를 옮기면서 서버실을 새로 구축했다. IT 인프라스트럭처도 완전히 새로 설계했다. IT 인프라 재정비의 하나로, 워너는 통신과 파일, 회계 서비스에 대해 강력한 보호 체계를 구축했다. 기존에는 파일 수준에서 클라우드로 백업했을 뿐 서버에 대한 복구 체계는 없었다. 그는 "만약 서버에 장애가 발생하면 며칠에 걸쳐 서버를 처음부터 다시 설정해야 하는 상황이었다. 제대로 된 재해복구 체계가 필요했다"라고 말했다.

당시 밀하우스에 가장 시급한 것은 커진 사업을 감당할 수 있고 더 많은 직원을 지원할 수 있는 인프라를 만드는 것이었다. 그리고 두 번째로 시급한 것이 재해복구, 즉 현실적인 백업 체계였다. 여기서 '현실적'이란 시스템을 처음부터 다시 만들지 않으면서도 안정적으로 재해복구를 지원해야 한다는 의미였다.

특히 밀하우스의 업무 시스템 중 가장 중요한 것은 전화 시스템이었다. 고급 아파트 거주자와 입주 예정자를 위한 핵심 서비스이면서 동시에 영업과 직원 지원에도 가장 일반적으로 사용하는 것이 전화였다. 더구나 밀하우스는 아파트를 설계하고 짓는 것 외에 관리 서비스까지 제공한다. 현재 12개 아파트에 전화 서비스를 제공하고 있다. 워너는 "이들 건물에서 언제든 전화를 사용할 수 있도록 관리하는 것이 IT 팀의 중요 업무다"라고 말했다.

이들 고급 아파트에 대한 네트워크 서비스는 더 다양해지고 있다. 고속 인터넷과 와이파이, TV, 홈 오토메이션 서비스 등이 대표적이다. 워너는 "우리는 이러한 서비스를 제공하기 위해 건물 전체에 자체 네트워크를 구축했다. 우리가 인터넷 회선을 대량으로 사들여 각 가정에 분배하는 방식이다. 일단 우리 건물로 이사를 오면 당일부터 광섬유 기반 고속 인터넷을 사용할 수 있다"라고 말했다.

밀하우스가 이들 서비스를 안정적으로 지원하고 재해에 대비하기 위해 주목한 것은 서비스로서 재해복구(DRaaS)였다. 유연성과 가격경쟁력, 전문가 지원 서비스 덕분에 최근 중소기업을 중심으로 도입 비율이 계속 높아지고 있다. 시장조사업체 포레스터 자료를 보면, 기업의 40%가 기업용 DRaaS를 도입했고 24%는 도입을 계획하고 있다.

밀하우스는 다양한 DRaaS 업체를 검토한 끝에 온라인 테크(Online Tech)를 선택했다. 하이브리드 클라우드와 코로케이션, 재해복구, 오프사이트 백업 서비스 등을 제공하는 업체다. 온라인 테크는 현재 자체 데이터센터에서 밀하우스에 파일 수준 백업과 이미지 백업을 DRaaS로 지원하고 있다.

밀하우스가 이 업체를 선택한 이유 중 하나는 원격지 백업과 재해복구를 지원한다는 점이다. 온라인 테크는 미국 내 3개 주에 걸쳐 총 7개 데이터센터를 운영하고 있다. 다양한 하이퍼바이저에 대한 페일오버와 페일백을 지원하는 것도 중요한 이유였다. 현재 밀하우스는 하이퍼-V로 표준화된 가상화 환경을 운영하고 있는데, 온라인 테크는 젤토(Zerto)의 가상화 복제 기술을 이용해 VM웨어와 마이크로소프트 하이퍼바이저 간에 복제를 지원한다. 여러 지역에 걸친 네이티브 멀티 테넌트도 가능하다.

밀하우스는 온라인 테크를 파트너로 선택한 이후 모든 데이터를 업체의 미시간 데이터센터로 이전, 복제했다. 젤토 솔루션을 이용했고 전체 작업을 마치는 데 한 달 이상 걸렸다. 워너는 "일부 문제가 있었지만 젤토 엔지니어와 함께 해법을 찾았다"라고 말했다.


이런 작업을 마친 후 지난해 12월 밀하우스는 새 재해복구 환경에 대한 첫 테스트를 했다. 워너는 "처음에는 이런 식으로는 절대 정상 작동하지 않을 것으로 생각했다. 그러나 문자 그대로 클릭 몇 번으로 서버가 생성됐고 로그인할 수 있었다. 가상머신을 전환하는 것만큼이나 빠르게 하이퍼바이저에서 작업이 수행됐다"라고 말했다.

이때는 단순한 테스트였지만, 밀하우스는 몇 달 후에는 실제 재해 상황에 직면했다. 아파트 옆에 통신탑이 있었는데 이곳이 낙뢰를 맞은 것이다. 워너는 "현장에 가보니 낙뢰로 통신탑이 땅으로 떨어지면서 지상의 통신 케이블 등을 파손한 상태였다. 서버실 내의 모든 스위치에서 장애가 발생하는 등 꽤 큰 네트워크 재해였다"라고 말했다.

통신과 전력 관련 기술자들이 장비를 복구, 교체할 수 있는지 확인하는 동안 워너는 온라인 테크에 연락을 취했다. 당시 장애가 계속됐다면 추가로 작업해야 할 것이 상당히 많았기 때문이다. 그러나 업체와 함께 젤토 기반의 업무 포탈에서 재해복구 작업을 시작하자, 테스트 때 작동했던 그대로 불과 몇 분 만에 모든 서버가 다시 나타났다.

그는 "모든 시스템이 제대로 백업되고 있었고 실제 재해 상황에서 이 시스템에 기대했던 대로 잘 작동했다. VoIP 전화 서비스 등 핵심 서비스의 장애 없이 재해 상황을 복구할 수 있었다"라고 말했다.

워너는 앞으로 핵심 서비스 일부를 추가로 고가용성 클라우드 환경으로 이전할 예정이다. 그는 "낙뢰는 물론 이와 비슷한 재해로부터 시스템을 보호하고 신뢰성을 높이기 위해 온라인 테크와 협력을 강화할 것이다. 핵심 서비스를 업체의 클라우드로 옮기는 것도 검토하고 있다. 이렇게 되면 온라인 테크가 직접 두 데이터센터 간에 복제해 시스템 장애에 대한 대비를 더 강화할 수 있다"라고 말했다. ciokr@idg.co.kr 

X