지난 6월, 두 차례의 정전 사고로 아마존 웹 서비스(AWS)의 기업 고객들인 인스타그램(Instagram), 핀터레스트(Pinterest), 넷플릭스(Netflix) 등이 자사의 고객 서비스 지원에 어려움을 겪어야 했다. 그런데, 이 AWS의 고객들에겐 아무런 책임이 없는 것일까?
글로벌 IaaS 업체 오스페로(Ospero)의 설립자 겸 CEO 제이슨 커릴은 “책임은 양 측 모두에게 있다. 우선 아마존은, 예비 전력의 문제를 보다 신중히 검토해야 할 필요성을 느꼈을 것이다. 이와 관련한 이슈는 첫 번째 정전 사고 이후 이미 제기된 것이다. 예비 전력은 데이터센터가 철저하게 검토해야 하는 기본 중의 기본이다”라고 설명했다.
'클라우드는 유틸리티다'
커릴은 AWS 클라이언트들에게도 일부 책임이 있다는 점을 강조했다. 자신들의 고객들이 서비스를 이용하는데 불편을 초래했기 때문이다.
그는 “당신 기업의 본사 건물 지하엔 정전에 대비한 디젤 발전기가 설치돼 있지 않나? 통신선은? 건물로 이어지는 통신선은 아마도 두 개로 나눠져 있을 것이다. 둘 중 하나에 문제가 발생해도 커뮤니케이션이 가능하도록 말이다. 그런데 클라우드에는 왜 이런 노력을 하지 않는가? 클라우드 역시 일종의 유틸리티다. 예비 클라우드를 마련하라”고 강조했다.
발전기의 정지와 소프트웨어 버그가 문제를 유발
6월 29일 발생한 두 번째 서비스 중단 사고 이후 발표된 사후 보고서에서 아마존 측은 일련의 정전 사태와 발전기의 문제, 그리고 백로그(backlog) 재부팅으로 인해 ‘많은 고객들에게 막대한 손실을 끼치게 되었다고 설명했다.
문제는 미 동부에 불어 닥친 폭풍의 영향으로 노스버지니아 지역에 정전 사태가 발생하며 시작됐다. 아마존은 이 지역에 복수의 가용성 존(availability)으로 구성된 10 개 이상의 데이터센터를 갖추고 있다. 이러한 구조는 분명 지난 29일의 사태와 같은 경우를 예방하기 위한 목적으로 설계된 것이다. 가용성 존은 서로 다른 위치에서 독립적인 인프라를 갖추고 운영되고 있다.