Offcanvas

데이터센터 / 분쟁|갈등 / 클라우드

아마존 정전 사고 1년, 클라우드 안전성을 생각한다

2012.05.02 Brandon Butler  |  Network World

변화 2 : AWS 정보 공유 약속
AWS는 향후 서비스 중단 사고가 발생하면 더욱 정직하게 정보를 공개하겠다고 약속했다. 지난해 4월 사고 당시에는 몇 시간이 지나서야 '네트워크에 문제가 발생했다'고만 발표해, 많은 고객들이 실제 무슨 일이 일어났는지, 또 언제 서비스가 재개되는지 정보를 갈망하도록 만들었다.

AWS의 홍보 책임자는 이메일을 통해, 사후 보고서에는 회사가 바꾼 조치들이 자세히 나와있다고 밝혔다. 이메일에는 "소프트웨어 수정, EC2 인스턴스 상태 감시, EBS 용량 상태 등의 새로운 기능이 포함돼 있다. 이는 고객이 AWS에서 실행 중인 자원의 건전성을 이해하는데 필요한 정보를 제공한다"라는 내용이 포함돼 있다.

아마존은 또 서비스 중단 시 고객이 스스로를 보호할 수 있는 방법을 강조해 설명했다. 이른바 AZ(Availability Zones)다. AWS는 이번 서비스 중단 사고의 진앙지인 미국 동부 해안 지역을 포함해 전세계의 8개 지역에 고객 데이터를 저장하고 있다. 그리고 각 지역마다 AZ가 위치해 있다. 물리적으로 분리돼 있고, 독립적으로 운영되는 기반으로 높은 데이터 유효성 달성이 가능한 지역이다. AWS는 여러 AZ에 데이터를 백업해 둔 고객일수록 서비스 중단 사고 발생시 영향을 덜 받을 것이라고 설명하고 있다.

변화 3 : 중단없는 서비스에 투자
AWS에 따르면, RDS를 이용하고 있는 고객 가운데, 한 곳의 AZ를 이용하고 있는 45%는 서비스 중단에 영향을 받았다. 반면 여러 곳의 AZ를 이용하는 고객의 경우 2.5%만 영향을 받았다. 아마존은 서비스 중단 사고 이후 여러 차례 백서와 웨비나(webinars)를 통해 고객들이 어떻게 하면 다중 AZ 시스템을 설계할 수 있는지를 홍보했다.

핸드릭에 따르면, 고객은 각자 위험 평가를 실시해, 서비스의 유효성을 높이려면 어느 정도 투자해야 하는지 판단해야 한다. 당연히 여러 AZ에 데이터를 복제해두려면 AWS 클라우드 요금이 올라가게 된다. 핸드릭에 따르면 약 50%가 인상될 수 있다. 그는 "고 유효성의 의미를 제대로 이해하는 기업이 얼마나 될는지 모르겠다"라고 말했다.

어림짐작으로 판단했을 때, 클라우드에 핵심 애플리케이션과 데이터를 더 많이 저장할수록, 고객이 고 유효성 확보에 투자하는 비용도 증가한다. 그러나 일부 고객에게는 다중 AZ 방식만으로는 충분하지 않다. 레디트의 수석 제품 개발자제레미 에드버그는 지난해 사고와 관련해, "우리는 서비스 중단을 예방하기 위해 항상 여러 지역에 분산시켜 데이터를 저장하고 있다. 그럼에도 불구하고 문제가 발생한 이유는 여러 지역에서 동시에 서비스가 중단됐기 때문이다"라고 말했다.

변화 4 : 데이터의 분산 저장
가트너의 애널리스트 리브스에 따르면, AWS의 다중 AZ 방식은 여러 지역에 데이터를 저장하는 것이다. AWS는 같은 단일 지역에 위치한 AZ 사이에만 공통 API를 허용하고 있다. 따라서 여러 지역에서 AZ를 이용하기 위해서는 별개의 API 요청이 필요하고, 이는 다소 복잡한 문제를 초래할 수 있다. 쿠오라가 지난해 서비스 중단 사고 이후 택한 방식이다. 소셜 미디어 사이트의 질의 응답 페이지에서 쿠오라의 한 엔지니어는 "쿠오라는 여러 지역에 걸쳐 데이터베이스를 이중화하는 전략을 통해 콘텐트를 분산시키고 있다"라고 밝혔다.

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.