2011.04.22

아마존 클라우드 서비스 장애 발생··· 업계 파장에 촉각

Sharon Gaudin | Computerworld

클라우드 시장에서 자타가 공인하는 선도 업체인 아마존이 서비스 장애로 자사의 명예에 먹칠을 한 것은 물론, 클라우드 서비스 시장 전반에 좋지 않은 인상을 남기고 말았다.

 

4월 21일 아침, 인기 웹 사이트인 쿠오라(Quora)와 포스퀘어(Foursquare), 레딧(Reddit) 등이 오락가락하는 서비스 상태이거나 완전히 서비스가 중단되는 사태를 겪었다. 원인은 이들 웹 사이트의 호스팅 서비스를 책임지고 있는 아마존 데이터센터의 서버에 문제가 생겼기 때문.

 

서비스는 미국 동부 시간으로 오후 4시에 복구됐지만, 이때까지 포스퀘어와 쿠오라 등은 서비스가 중단된 상태로 있어야 했다. 서비스가 중단되지는 않았지만, 극히 불안정한 상태였던 레딧은 자사 사이트를 통해 “레딧은 현재 ”비상 읽기전용 모드“인데, 아마존이 서비스 중단 상태이기 때문이다”라고 밝혔다. 레딧 사용자는 로그인을 할 수 없는 불편을 겪었다.

 

웹 성능 측정 전문업체인 얼럿사이트(AlertSite)에 따르면, 21일 오전 6시부터 오푸 1시까지, 레딧 사이트는 페이지 로딩에 60초가 걸려서 장애에 대한 안내만 보여줬다. 포스퀘어 역시 오전 8시 15분부터 정오까지 장애 이율르 설명하는 메시지를 내보냈다.

 

21일 새벽 5시, 이들 사이트의 관리자들은 아마존의 RDB 서비스에 영향을 미치고 있는 접속 문제를 처리하고 있다고 보고했다. 이 서비스는 클라우드 데이터베이스 관리에 사요오디는 것으로, 문제는 미국 동부의 여러 지역에서 일어났다.

 

이는 최소한 11시간 동안 일부 웹 사이트가 완전히 정지됐거나 부분적으로 이용 불가능한 상태였다는 것을 의미한다.

 

이런 사태는 다운된 사이트에게도 문제였지만, 아마존 자체로는 더욱 더 심각한 문제가 아닐 수 없다. IDC의 애널리스트 로버트 마호월드는 “아마존은 운영 가동시간 패러다임을 선도하는 곳으로 여겨지고 있다”며, “이런 문제가 아마존에서 발생하면, 관련 업계 전체에 찬바람이 불게 된다. 이는 분명히 큰 불명예이다”라고 강조했다.

 

하지만 마호월드는 아마존에 특별한 운영상의 문제가 있다고 지적하지는 않았다. “사람들이 이번 일로 아마존을 이용하지 않을 것이라고는 생각하지 않는다. 하지만 그동안 문제가 많았던 업체들에게 서비스 중단에 대한 여러 가지 핑계거리를 제공할 것”이라고 덧붙였다.

 

엔델레 그룹의 애널리스트 롭 엔델레는 가장 큰 타격은 클라우드 자체가 받은 것으로 보고 있다. 엔델레는 “사용자들이 신뢰할만한 기술이라는 이미지가 치명적인 타격을 입었다”라며, “만약 서비스 중단이 더 오래 지속됐다면, 올해 관련 서비스 분야의 성장에도 영향을 미칠 수 있다”고 지적했다.

 

아마존의 명성을 고려하면, 이번 상태가 기업의 IT 인프라를 클라우드로 옮기기로 결정한 사람들에게는 도저히 잊을 수 없는 일이 될 것이다. 엔델레는 “이번 사태는 이런 종류의 서비스와 관련된 위험을 너무나 잘 보여준다. 마치 기반 시설처럼 판매되고 있지만, 기대만큼의 안정성을 제공하지 못하는 것이다”라며, “만약 서비스 중단이 계속됐다면, 업계가 이를 회복하는 데 5년 이상이 걸릴지도 모른다”라고 덧붙였다. 

ciokr@idg.co.kr




2011.04.22

아마존 클라우드 서비스 장애 발생··· 업계 파장에 촉각

Sharon Gaudin | Computerworld

클라우드 시장에서 자타가 공인하는 선도 업체인 아마존이 서비스 장애로 자사의 명예에 먹칠을 한 것은 물론, 클라우드 서비스 시장 전반에 좋지 않은 인상을 남기고 말았다.

 

4월 21일 아침, 인기 웹 사이트인 쿠오라(Quora)와 포스퀘어(Foursquare), 레딧(Reddit) 등이 오락가락하는 서비스 상태이거나 완전히 서비스가 중단되는 사태를 겪었다. 원인은 이들 웹 사이트의 호스팅 서비스를 책임지고 있는 아마존 데이터센터의 서버에 문제가 생겼기 때문.

 

서비스는 미국 동부 시간으로 오후 4시에 복구됐지만, 이때까지 포스퀘어와 쿠오라 등은 서비스가 중단된 상태로 있어야 했다. 서비스가 중단되지는 않았지만, 극히 불안정한 상태였던 레딧은 자사 사이트를 통해 “레딧은 현재 ”비상 읽기전용 모드“인데, 아마존이 서비스 중단 상태이기 때문이다”라고 밝혔다. 레딧 사용자는 로그인을 할 수 없는 불편을 겪었다.

 

웹 성능 측정 전문업체인 얼럿사이트(AlertSite)에 따르면, 21일 오전 6시부터 오푸 1시까지, 레딧 사이트는 페이지 로딩에 60초가 걸려서 장애에 대한 안내만 보여줬다. 포스퀘어 역시 오전 8시 15분부터 정오까지 장애 이율르 설명하는 메시지를 내보냈다.

 

21일 새벽 5시, 이들 사이트의 관리자들은 아마존의 RDB 서비스에 영향을 미치고 있는 접속 문제를 처리하고 있다고 보고했다. 이 서비스는 클라우드 데이터베이스 관리에 사요오디는 것으로, 문제는 미국 동부의 여러 지역에서 일어났다.

 

이는 최소한 11시간 동안 일부 웹 사이트가 완전히 정지됐거나 부분적으로 이용 불가능한 상태였다는 것을 의미한다.

 

이런 사태는 다운된 사이트에게도 문제였지만, 아마존 자체로는 더욱 더 심각한 문제가 아닐 수 없다. IDC의 애널리스트 로버트 마호월드는 “아마존은 운영 가동시간 패러다임을 선도하는 곳으로 여겨지고 있다”며, “이런 문제가 아마존에서 발생하면, 관련 업계 전체에 찬바람이 불게 된다. 이는 분명히 큰 불명예이다”라고 강조했다.

 

하지만 마호월드는 아마존에 특별한 운영상의 문제가 있다고 지적하지는 않았다. “사람들이 이번 일로 아마존을 이용하지 않을 것이라고는 생각하지 않는다. 하지만 그동안 문제가 많았던 업체들에게 서비스 중단에 대한 여러 가지 핑계거리를 제공할 것”이라고 덧붙였다.

 

엔델레 그룹의 애널리스트 롭 엔델레는 가장 큰 타격은 클라우드 자체가 받은 것으로 보고 있다. 엔델레는 “사용자들이 신뢰할만한 기술이라는 이미지가 치명적인 타격을 입었다”라며, “만약 서비스 중단이 더 오래 지속됐다면, 올해 관련 서비스 분야의 성장에도 영향을 미칠 수 있다”고 지적했다.

 

아마존의 명성을 고려하면, 이번 상태가 기업의 IT 인프라를 클라우드로 옮기기로 결정한 사람들에게는 도저히 잊을 수 없는 일이 될 것이다. 엔델레는 “이번 사태는 이런 종류의 서비스와 관련된 위험을 너무나 잘 보여준다. 마치 기반 시설처럼 판매되고 있지만, 기대만큼의 안정성을 제공하지 못하는 것이다”라며, “만약 서비스 중단이 계속됐다면, 업계가 이를 회복하는 데 5년 이상이 걸릴지도 모른다”라고 덧붙였다. 

ciokr@idg.co.kr


X