Offcanvas

������

디지털 시대의 'IT 회복 탄력성'이란?··· 7가지 개선 팁

과거 IT 회복 탄력성은 가동 시간에 집중하는 것이었다. 시스템이 중단되는 일이 없도록 조치하고 만약 중단되면 최대한 빠르게 온라인 상태로 복구하는 것에 초점을 맞추곤 했다. 그러나 오늘날 IT 회복 탄력성은 그보다 훨씬 더 많은 것을 의미한다. 브래드 스톤의 의견이 이를 잘 반영한다. 부즈 알렌 해밀턴(Booz Allen Hamilton) CIO로서 스톤은 회복 탄력성을 2가지 차원으로 생각한다고 말했다. 한 가지는 회사를 중단 없이 가동되게 하는 것이고 두 번째는 적응하고 변화에 대처하며 예상치 못한 것을 처리하는 능력을 갖추는 것이다. 또한 스톤은 이제 회복 탄력성의 의미는 이 모든 것을 하는 동시에 사용자가 기대하는 경험을 지속적으로 제공하는 것이라고 말했다. 그는 “10년 전에는 중단 현상이 발생해도 넘어 가곤 했다. 그러나 오늘날의 기대치는 다르다. 사용자와 비즈니스 리더들은 기술이 항상 작동하고 놀라운 경험이 될 것을 기대한다. IT의 중요성이 더욱 커졌기 때문에 이제 기대치가 훨씬 더 높다. 완벽함은 아닐지언정 기준이 매우 높다”라고 말했다. 그러한 변화는 오늘날 IT 회복 탄력성 보장을 위한 보다 포괄적인 접근 방식을 촉발시켰다. 전문가들과 IT 리더들이 추천하는 최선의 실천 과제 7가지를 소개한다.   1. 비즈니스 수요에 맞춰 조정할 것 자문 및 서비스 회사 가이드포인트 시큐리티(GuidePoint Security) 비즈니스 회복 탄력성 책임자 론 브라운은 IT 회복 탄력성에 대해 기술의 상시 가용성을 보장하는 것이라고 정의하면서도 완벽할 가능성이 낮다는 점을 인정한다. 그는 “언젠가는 중단이 발생한다는 사실에 대비해 계획을 수립할 필요가 분명히 있다”라고 강조했다. 그는 CIO들이 그런 불가피한 사태에 대비할 최선의 방법은 회사에게 가장 중요한 시스템이 무엇인지 명확히 함으로써 IT 부서가 어떤 종류의 정전 중에도 첫번째로 집중할 것이 무엇인지 알게 하는 것이라고 조언했다. 브라운은 “의심할 것 없이 첫번째로 할 ...

회복 탄력성 사일로 비즈니스 연속성 BCP 대응성 재난 DR 정전 중지

2022.07.27

과거 IT 회복 탄력성은 가동 시간에 집중하는 것이었다. 시스템이 중단되는 일이 없도록 조치하고 만약 중단되면 최대한 빠르게 온라인 상태로 복구하는 것에 초점을 맞추곤 했다. 그러나 오늘날 IT 회복 탄력성은 그보다 훨씬 더 많은 것을 의미한다. 브래드 스톤의 의견이 이를 잘 반영한다. 부즈 알렌 해밀턴(Booz Allen Hamilton) CIO로서 스톤은 회복 탄력성을 2가지 차원으로 생각한다고 말했다. 한 가지는 회사를 중단 없이 가동되게 하는 것이고 두 번째는 적응하고 변화에 대처하며 예상치 못한 것을 처리하는 능력을 갖추는 것이다. 또한 스톤은 이제 회복 탄력성의 의미는 이 모든 것을 하는 동시에 사용자가 기대하는 경험을 지속적으로 제공하는 것이라고 말했다. 그는 “10년 전에는 중단 현상이 발생해도 넘어 가곤 했다. 그러나 오늘날의 기대치는 다르다. 사용자와 비즈니스 리더들은 기술이 항상 작동하고 놀라운 경험이 될 것을 기대한다. IT의 중요성이 더욱 커졌기 때문에 이제 기대치가 훨씬 더 높다. 완벽함은 아닐지언정 기준이 매우 높다”라고 말했다. 그러한 변화는 오늘날 IT 회복 탄력성 보장을 위한 보다 포괄적인 접근 방식을 촉발시켰다. 전문가들과 IT 리더들이 추천하는 최선의 실천 과제 7가지를 소개한다.   1. 비즈니스 수요에 맞춰 조정할 것 자문 및 서비스 회사 가이드포인트 시큐리티(GuidePoint Security) 비즈니스 회복 탄력성 책임자 론 브라운은 IT 회복 탄력성에 대해 기술의 상시 가용성을 보장하는 것이라고 정의하면서도 완벽할 가능성이 낮다는 점을 인정한다. 그는 “언젠가는 중단이 발생한다는 사실에 대비해 계획을 수립할 필요가 분명히 있다”라고 강조했다. 그는 CIO들이 그런 불가피한 사태에 대비할 최선의 방법은 회사에게 가장 중요한 시스템이 무엇인지 명확히 함으로써 IT 부서가 어떤 종류의 정전 중에도 첫번째로 집중할 것이 무엇인지 알게 하는 것이라고 조언했다. 브라운은 “의심할 것 없이 첫번째로 할 ...

2022.07.27

네트워크 문제로 인한 데이터센터 가동 정지 증가··· 이유는?

데이터센터 가동 정지를 유발하는 일반적인 원인 중 하나는 정전이다. 그러나 정전이 유일한 원인은 아니다. 기업 컴퓨팅 환경의 복잡성이 높아지면서 IT 시스템과 네트워크의 장애로 인해 데이터센터 가동이 멈추는 사례가 늘고 있는 것으로 나타났다.   업타임 인스티튜트(Uptime Institute)는 불시의 다운타임을 유발하는 요소를 파악하고자 공개적으로 보고된 가동 정지 사례를 연구해왔다. 지난 3년 동안 전통적인 미디어 또는 소셜 미디어에 보고된 162건의 가동 정지 사례에서 정보를 수집했는데, 이 기간 동안 가용 데이터의 양은 꾸준히 증가했다. 연구진이 데이터를 수집한 가동 정지 사례는 2016년 27건, 2017년 57건에 이어 2018년에는 78건으로 늘었다. 복원성 서비스와 데이터센터 구축 및 운영 자문, 인증 서비스를 제공하는 업타임 인스티튜트의 리서치 책임자 앤디 로렌스는 “뉴스에 보도되는 가동 정지 사례가 계속 증가하고 있다”고 말했다. 로렌스는 이번 연구 결과를 발표하면서 “업계의 기록을 보면 거의 매일 전 세계 곳곳에서 심각한 가동 정지가 발생한다”면서 “가동 정지 건수 자체가 급증한다고 단정할 수는 없지만, 다운타임에 대한 관심은 커지고 있다. 정지가 미치는 영향이 확대되고 있는 것은 분명해 보인다”고 말했다. 업타임 인스티튜트 연구에서 발견한 중대한 사실은 전체적인 장애에서 정전보다 네트워크와 IT 시스템의 문제가 원인으로 작용하는 경우가 더 많다는 것이다. 전원 시스템의 안정성이 과거에 비해 향상되면서 온프레미스 데이터센터의 전원 장애가 줄어든 덕분이다. 업타임 인스티튜트의 CTO 크리스 브라운은 지난 20년 동안 IT 업계는 전원 시스템의 일부에 오류 또는 장애가 발생하더라도 IT 자산 운영을 지속할 수 있게 해주는 시스템을 설계하는 데 주력해왔다면서 “이중 코드 IT 장비에 전원을 공급하는 2N 전원 분배 시스템이 나오면서 IT 시스템은 단일...

서비스중단 정전 장애 가용성

2019.03.26

데이터센터 가동 정지를 유발하는 일반적인 원인 중 하나는 정전이다. 그러나 정전이 유일한 원인은 아니다. 기업 컴퓨팅 환경의 복잡성이 높아지면서 IT 시스템과 네트워크의 장애로 인해 데이터센터 가동이 멈추는 사례가 늘고 있는 것으로 나타났다.   업타임 인스티튜트(Uptime Institute)는 불시의 다운타임을 유발하는 요소를 파악하고자 공개적으로 보고된 가동 정지 사례를 연구해왔다. 지난 3년 동안 전통적인 미디어 또는 소셜 미디어에 보고된 162건의 가동 정지 사례에서 정보를 수집했는데, 이 기간 동안 가용 데이터의 양은 꾸준히 증가했다. 연구진이 데이터를 수집한 가동 정지 사례는 2016년 27건, 2017년 57건에 이어 2018년에는 78건으로 늘었다. 복원성 서비스와 데이터센터 구축 및 운영 자문, 인증 서비스를 제공하는 업타임 인스티튜트의 리서치 책임자 앤디 로렌스는 “뉴스에 보도되는 가동 정지 사례가 계속 증가하고 있다”고 말했다. 로렌스는 이번 연구 결과를 발표하면서 “업계의 기록을 보면 거의 매일 전 세계 곳곳에서 심각한 가동 정지가 발생한다”면서 “가동 정지 건수 자체가 급증한다고 단정할 수는 없지만, 다운타임에 대한 관심은 커지고 있다. 정지가 미치는 영향이 확대되고 있는 것은 분명해 보인다”고 말했다. 업타임 인스티튜트 연구에서 발견한 중대한 사실은 전체적인 장애에서 정전보다 네트워크와 IT 시스템의 문제가 원인으로 작용하는 경우가 더 많다는 것이다. 전원 시스템의 안정성이 과거에 비해 향상되면서 온프레미스 데이터센터의 전원 장애가 줄어든 덕분이다. 업타임 인스티튜트의 CTO 크리스 브라운은 지난 20년 동안 IT 업계는 전원 시스템의 일부에 오류 또는 장애가 발생하더라도 IT 자산 운영을 지속할 수 있게 해주는 시스템을 설계하는 데 주력해왔다면서 “이중 코드 IT 장비에 전원을 공급하는 2N 전원 분배 시스템이 나오면서 IT 시스템은 단일...

2019.03.26

스마트홈 기기에 침투한 봇넷, 전력망 무너뜨릴 수도

인터넷과 연결된 ‘스마트’ 가전에 봇넷이 침투한다면 전력망까지 영향을 끼쳐 대규모 정전으로 이어질 수 있다는 연구가 발표됐다. 유즈닉스(USENIX) 보안 심포지엄에서 프린스턴대학교 연구원의 발표에 따르면, 인터넷을 통해 원격으로 제어할 수 있는 스마트 가전이 훼손되어 봇넷에서 사용될 경우 공격자는 로컬 정전이나 대규모 정전을 유발할 수 있다. 프린스턴대학교 전기공학과 연구원들은 이 새로운 종류의 공격을 MadIoT(Manipulation of demand via IoT)라고 불렸다. 이는 전력망의 공급 측면을 직접 공격하는 게 아니라 공격자가 봇넷의 고출력 IoT 기기를 노예화하여 그리드의 수요 측면을 조작할 수 있는 게 특징이다. 와이파이와 연결된 고출력 가전제품을 사용하면 에코의 알렉사나 구글홈 같은 앱이나 가정용 비서를 통해 집에 도착하기 전에 원격지에서도 AC나 오븐을 작동할 수 있어 생활이 편리해진다. 가전을 원격 제어하는 것은 공격자가 전력 수요를 조작하는 데 사용될 수 있다. 프린스턴 연구원은 에어컨, 히터, 전기온수기, 전기오븐이 1,000~5,000와트의 전력을 사용한다고 가정한 후에 실제 전력망의 최첨단 시뮬레이터에서 테스트한 세 가지 공격 유형 모델을 생각해 냈다. 결과는 지역 정전으로 대규모 정전으로 이어졌다. 주파수 불안정을 초래한 공격 연구원들은 웨스턴 시스템 코디네이팅 카운슬(Western System Coordinating Council)의 유틸리티 그리드 모델에 대해 테스트된 것과 같은 목표 지역에서 전력 수요를 교란하기 위해 9만 대의 에어컨과 1만 8,000대의 전기온수기로 구성된 봇넷을 사용할 것으로 가정을 토대로 연구했다. 공격자는 동시에 모든 봇넷 제어 어플라이언스를 켤 때와 같이 급격한 전원 공급이 발생할 수 있다. 동시에 그들을 모두 끄면 주파수가 불안정해질 수 있다. 전력 수요의 급격한 증가 또는 감소는 공급과 수요 사이의 불균형을 야기했다. 연구원들은...

CSO 유즈닉스 보안 심포지엄 프린스턴대학교 Manipulation of demand via IoT 에어컨 온수기 전력망 사물인터넷 스마트홈 가전 봇넷 그리드 CISO 정전 MadIoT

2018.08.30

인터넷과 연결된 ‘스마트’ 가전에 봇넷이 침투한다면 전력망까지 영향을 끼쳐 대규모 정전으로 이어질 수 있다는 연구가 발표됐다. 유즈닉스(USENIX) 보안 심포지엄에서 프린스턴대학교 연구원의 발표에 따르면, 인터넷을 통해 원격으로 제어할 수 있는 스마트 가전이 훼손되어 봇넷에서 사용될 경우 공격자는 로컬 정전이나 대규모 정전을 유발할 수 있다. 프린스턴대학교 전기공학과 연구원들은 이 새로운 종류의 공격을 MadIoT(Manipulation of demand via IoT)라고 불렸다. 이는 전력망의 공급 측면을 직접 공격하는 게 아니라 공격자가 봇넷의 고출력 IoT 기기를 노예화하여 그리드의 수요 측면을 조작할 수 있는 게 특징이다. 와이파이와 연결된 고출력 가전제품을 사용하면 에코의 알렉사나 구글홈 같은 앱이나 가정용 비서를 통해 집에 도착하기 전에 원격지에서도 AC나 오븐을 작동할 수 있어 생활이 편리해진다. 가전을 원격 제어하는 것은 공격자가 전력 수요를 조작하는 데 사용될 수 있다. 프린스턴 연구원은 에어컨, 히터, 전기온수기, 전기오븐이 1,000~5,000와트의 전력을 사용한다고 가정한 후에 실제 전력망의 최첨단 시뮬레이터에서 테스트한 세 가지 공격 유형 모델을 생각해 냈다. 결과는 지역 정전으로 대규모 정전으로 이어졌다. 주파수 불안정을 초래한 공격 연구원들은 웨스턴 시스템 코디네이팅 카운슬(Western System Coordinating Council)의 유틸리티 그리드 모델에 대해 테스트된 것과 같은 목표 지역에서 전력 수요를 교란하기 위해 9만 대의 에어컨과 1만 8,000대의 전기온수기로 구성된 봇넷을 사용할 것으로 가정을 토대로 연구했다. 공격자는 동시에 모든 봇넷 제어 어플라이언스를 켤 때와 같이 급격한 전원 공급이 발생할 수 있다. 동시에 그들을 모두 끄면 주파수가 불안정해질 수 있다. 전력 수요의 급격한 증가 또는 감소는 공급과 수요 사이의 불균형을 야기했다. 연구원들은...

2018.08.30

정전 사고 터진 CES 2018··· 기술 기업들의 발빠른 소셜 활동 이모저모

라스베이거스에서 열리고 있는 CES 2018에서 정전 사태가 발생했다. IBM과 인텔 등의 기술 기업들은 이를 소셜 미디어에서 다양한 방식으로 공유했다. 정전을 둘째 날 현지 시작 오전 11시 13분 발생했다. 사우스 홀 내의 전력을 몇 분만에 복구됐지만 중앙 홀의 전력이 완전히 복구되기까지는 2시간 여가 소요됐다. 주최측은 소비자 기술 협회(Consumer Technology Association)는 최근의 폭우로 인해 지붕에 물이 고이면서 시설의 변압기 중 하나를 단락시켰다고 전했다. 참석자들은 세계 최대의 기술 전시회에서 발생한 이번 사고를 신속하게 전했다. 로봇 기업 죽스(Zoox)의 규제 책임자는 "수천 명의 참석자가 LVCC에서 나갔으며 값비싼 마케팅 활동이 중단됐다. 전기가 없이는 아무 것도 작동하지 않는다는 현실을 상기시켰다"라고 트위터를 통해 알렸다. 다른 참석자는 데릭 커톤은 미 수퍼볼 이벤트 때의 정전 사고를 떠올리며 이번 정전 사태를 어떤 브랜드가 기회로 삼을지 궁금해했다. 실제로 인텔과 IBM, 텍사스 인스트루먼츠와 같은 기술 기업들이 #CESblackout 해시 태그를 통해 사회적 대화에 빠르게 참여했다. 인텔은 이번 정전이 5G 이후 CES를 강타한 최대의 사건이라고 표현했다. Introducing Blackout™: The biggest thing to hit #CES2018 since #5G. #CESblackout pic.twitter.com/xObxxxHvQe — Intel (@intel) 2018년 1월 10일 IBM은 자사의 인공지능 기술인 왓슨을 강조하는 기회로 활용했다. Introducing Blackout™: The biggest thing to hit #CES2018 since #5G. #CESblackout pic.twitter.com/xObxxxHvQe — Intel (@int...

정전 CES 2018

2018.01.11

라스베이거스에서 열리고 있는 CES 2018에서 정전 사태가 발생했다. IBM과 인텔 등의 기술 기업들은 이를 소셜 미디어에서 다양한 방식으로 공유했다. 정전을 둘째 날 현지 시작 오전 11시 13분 발생했다. 사우스 홀 내의 전력을 몇 분만에 복구됐지만 중앙 홀의 전력이 완전히 복구되기까지는 2시간 여가 소요됐다. 주최측은 소비자 기술 협회(Consumer Technology Association)는 최근의 폭우로 인해 지붕에 물이 고이면서 시설의 변압기 중 하나를 단락시켰다고 전했다. 참석자들은 세계 최대의 기술 전시회에서 발생한 이번 사고를 신속하게 전했다. 로봇 기업 죽스(Zoox)의 규제 책임자는 "수천 명의 참석자가 LVCC에서 나갔으며 값비싼 마케팅 활동이 중단됐다. 전기가 없이는 아무 것도 작동하지 않는다는 현실을 상기시켰다"라고 트위터를 통해 알렸다. 다른 참석자는 데릭 커톤은 미 수퍼볼 이벤트 때의 정전 사고를 떠올리며 이번 정전 사태를 어떤 브랜드가 기회로 삼을지 궁금해했다. 실제로 인텔과 IBM, 텍사스 인스트루먼츠와 같은 기술 기업들이 #CESblackout 해시 태그를 통해 사회적 대화에 빠르게 참여했다. 인텔은 이번 정전이 5G 이후 CES를 강타한 최대의 사건이라고 표현했다. Introducing Blackout™: The biggest thing to hit #CES2018 since #5G. #CESblackout pic.twitter.com/xObxxxHvQe — Intel (@intel) 2018년 1월 10일 IBM은 자사의 인공지능 기술인 왓슨을 강조하는 기회로 활용했다. Introducing Blackout™: The biggest thing to hit #CES2018 since #5G. #CESblackout pic.twitter.com/xObxxxHvQe — Intel (@int...

2018.01.11

'위기 대응도 연습 필요' 6가지 준비 사항

비즈니스 연속성을 위한 IT 탄력성 구축은 모든 시스템을 원활하게 운영하는 데 필수적이다. 대부분 기업은 IT시스템에 크게 의존한다. 천재지변, 일시적인 정전, 데이터센터 손실, 랜섬웨어, 해킹, 파일 손실이나 손상, 소프트웨어 바이러스가 애플리케이션에 오류를 일으켜 시스템이 죽으면 상당한 재정적 손실이 발생할 수 있다. 최악의 경우, 비즈니스가 기능을 수행할 수 없는 지경에 이른다. IT 탄력성은 위기 상황에서 비즈니스 연속성을 보장해 준다. 단, 사전에 이를 고려해 부지런히 준비해야 한다. 다음은 비즈니스 연속성 서비스 업체인 액시언트(Axcient)의 토드 스칼란은 IT를 탄력 있게 만드는 데 필요한 6가지를 다음과 같이 정리했다. 비즈니스 매개 변수 이해하라 각 비즈니스에는 고유한 위험 허용 기준이 있다. 따라서 그에 따른 보호와 복구가 필요하다. 이러한 요소는 예기치 않은 중단을 처리하기 위해 어떻게 준비해야 하는지에 영향을 준다. 비즈니스 매개 변수를 이해하려면 먼저 중요한 시스템을 파악해야 한다. 그런 다음 중요한 시스템과 중요하지 않은 시스템에 대해 얼마나 많은 데이터 손실과 다운타임을 견딜 수 있나? 적절한 보호 일정은 무엇인가? 1시간, 1일 또는 1주일 동안 다운됐을 때 어떤 영향을 받나? 매출 감소, 고객 유실 및 직원 생산성 감소라는 측면에서 잠재적 정전을 계량화할 수 있나? 이 질문에 관한 답변을 정리했다면, 연속성 시스템을 만들 준비가 끝난 것이다. 비즈니스 중단을 초래할 수 있는 시나리오를 작성하라 가동 중단을 초래할 수 있는 가능한 시나리오를 작성해야 각 상황에 맞게 적절히 계획할 수 있다. 위기를 계획할 때 대부분 기업은 자연재해 유형의 사고가 주범이라고 가정한다. 이 가정을 확장하여 중재 공격, 서버 장애, 정전, 사용자 실수(예 : 실수로 데이터 삭제)를 비롯한 다른 시나리오를 포함하면 훨씬 더 강력하고 포괄적인 연속성 전략으로 이어질 것이다. 완벽하게 복구할 수 있도록 기술 요구 ...

CSO 파일 손상 천재지변 액시언트 IT 탄력성 랜섬웨어 자연재해 비즈니스 연속성 바이러스 복구 BCP DR 위기 정전 해킹 온 디맨드 컴퓨팅

2017.01.03

비즈니스 연속성을 위한 IT 탄력성 구축은 모든 시스템을 원활하게 운영하는 데 필수적이다. 대부분 기업은 IT시스템에 크게 의존한다. 천재지변, 일시적인 정전, 데이터센터 손실, 랜섬웨어, 해킹, 파일 손실이나 손상, 소프트웨어 바이러스가 애플리케이션에 오류를 일으켜 시스템이 죽으면 상당한 재정적 손실이 발생할 수 있다. 최악의 경우, 비즈니스가 기능을 수행할 수 없는 지경에 이른다. IT 탄력성은 위기 상황에서 비즈니스 연속성을 보장해 준다. 단, 사전에 이를 고려해 부지런히 준비해야 한다. 다음은 비즈니스 연속성 서비스 업체인 액시언트(Axcient)의 토드 스칼란은 IT를 탄력 있게 만드는 데 필요한 6가지를 다음과 같이 정리했다. 비즈니스 매개 변수 이해하라 각 비즈니스에는 고유한 위험 허용 기준이 있다. 따라서 그에 따른 보호와 복구가 필요하다. 이러한 요소는 예기치 않은 중단을 처리하기 위해 어떻게 준비해야 하는지에 영향을 준다. 비즈니스 매개 변수를 이해하려면 먼저 중요한 시스템을 파악해야 한다. 그런 다음 중요한 시스템과 중요하지 않은 시스템에 대해 얼마나 많은 데이터 손실과 다운타임을 견딜 수 있나? 적절한 보호 일정은 무엇인가? 1시간, 1일 또는 1주일 동안 다운됐을 때 어떤 영향을 받나? 매출 감소, 고객 유실 및 직원 생산성 감소라는 측면에서 잠재적 정전을 계량화할 수 있나? 이 질문에 관한 답변을 정리했다면, 연속성 시스템을 만들 준비가 끝난 것이다. 비즈니스 중단을 초래할 수 있는 시나리오를 작성하라 가동 중단을 초래할 수 있는 가능한 시나리오를 작성해야 각 상황에 맞게 적절히 계획할 수 있다. 위기를 계획할 때 대부분 기업은 자연재해 유형의 사고가 주범이라고 가정한다. 이 가정을 확장하여 중재 공격, 서버 장애, 정전, 사용자 실수(예 : 실수로 데이터 삭제)를 비롯한 다른 시나리오를 포함하면 훨씬 더 강력하고 포괄적인 연속성 전략으로 이어질 것이다. 완벽하게 복구할 수 있도록 기술 요구 ...

2017.01.03

우크라이나 대규모 정전··· 사이버 공격 가능성 조사중

지난 주말 우크라이나 수도 키예프와 주변 지역에서 발생한 정전과 관련해 사이버 공격 가능성에 대한 조사가 진행중이다. 사실로 밝혀질 경우 우크라이나에서 발생한 해커에 의한 두번째 정전 사태로 기록될 전망이다. Image Credit: IDGNS 이번 사고는 키예프에 인접한 노비 페르리찌 근처 북측 변전소의 자동 제어시스템에서 발생했다. 토요일과 일요일 사이 자정 정도에 장애가 나타났고, 이는 키예프 북쪽 지역 전반의 정전으로 이어졌다. 우크라이나 국영 전력회사인 우크레너고(Ukrenergo) 관계자는 페이스북을 통해 "장비를 수동 제어 모드로 바꾸고 30분만에 전력을 복구했다"라고 밝혔다. 모든 지역의 전력이 복구하는 데는 1시간 15분이 걸렸다. 원인으로 의심되는 것 중 하나는 데이터 네트워크를 통한 외부의 침입이다. 업체의 사이버 보안 전문가들은 현재 이를 조사하고 있으며 보고서를 발표할 예정이다. 또다른 원인으로 해킹과 장비의 고장이 거론되고 있다. 우크라이나 사법 당국은 이미 이에 대한 조사를 벌이고 있다. 조사 결과가 나오기 전까지 모든 시스템은 자동 제어에서 수동 제어로 전환하기로 했다고 업체 측은 설명했다. 해킹이 사실로 밝혀진다면 우크라이나에서 사이버공격으로 전력 공급에 문제가 생긴 2번째 사례가 된다. 약 1년 전 크리스마스 전에 해커가 우크라이나의 3개 지역 전력 회사를 공격했다. 그들은 여러 변전소의 시스템을 무력화시켰고 최소 3시간에서 최대 6시간까지 여러 지역에 정전 사태가 발생했다. 당시 우크라이나의 보안국(SBU)은 이 공격이 러시아의 소행이라고 주장했다. 명백한 증거는 없었지만 공격자가 '블랙에너지(BlackEnergy)'라고 불리는 러시아 해커 그룹의 악성코드 일부를 사용했고, 정교하고 복잡하게 공격이 이뤄졌으므로 정부 단위의 개입이 있었을 것이라고 분석했다. 이번 정전 사태에 앞서 보안업체 ESET의 연구자들은 블랙에너지 그룹과 유사한 해커집단에 의해 우크라이나 금융...

보안 해킹 정전 전력

2016.12.21

지난 주말 우크라이나 수도 키예프와 주변 지역에서 발생한 정전과 관련해 사이버 공격 가능성에 대한 조사가 진행중이다. 사실로 밝혀질 경우 우크라이나에서 발생한 해커에 의한 두번째 정전 사태로 기록될 전망이다. Image Credit: IDGNS 이번 사고는 키예프에 인접한 노비 페르리찌 근처 북측 변전소의 자동 제어시스템에서 발생했다. 토요일과 일요일 사이 자정 정도에 장애가 나타났고, 이는 키예프 북쪽 지역 전반의 정전으로 이어졌다. 우크라이나 국영 전력회사인 우크레너고(Ukrenergo) 관계자는 페이스북을 통해 "장비를 수동 제어 모드로 바꾸고 30분만에 전력을 복구했다"라고 밝혔다. 모든 지역의 전력이 복구하는 데는 1시간 15분이 걸렸다. 원인으로 의심되는 것 중 하나는 데이터 네트워크를 통한 외부의 침입이다. 업체의 사이버 보안 전문가들은 현재 이를 조사하고 있으며 보고서를 발표할 예정이다. 또다른 원인으로 해킹과 장비의 고장이 거론되고 있다. 우크라이나 사법 당국은 이미 이에 대한 조사를 벌이고 있다. 조사 결과가 나오기 전까지 모든 시스템은 자동 제어에서 수동 제어로 전환하기로 했다고 업체 측은 설명했다. 해킹이 사실로 밝혀진다면 우크라이나에서 사이버공격으로 전력 공급에 문제가 생긴 2번째 사례가 된다. 약 1년 전 크리스마스 전에 해커가 우크라이나의 3개 지역 전력 회사를 공격했다. 그들은 여러 변전소의 시스템을 무력화시켰고 최소 3시간에서 최대 6시간까지 여러 지역에 정전 사태가 발생했다. 당시 우크라이나의 보안국(SBU)은 이 공격이 러시아의 소행이라고 주장했다. 명백한 증거는 없었지만 공격자가 '블랙에너지(BlackEnergy)'라고 불리는 러시아 해커 그룹의 악성코드 일부를 사용했고, 정교하고 복잡하게 공격이 이뤄졌으므로 정부 단위의 개입이 있었을 것이라고 분석했다. 이번 정전 사태에 앞서 보안업체 ESET의 연구자들은 블랙에너지 그룹과 유사한 해커집단에 의해 우크라이나 금융...

2016.12.21

최근 우크라이나 정전 사태, 악성코드가 길 터줬다… SANS ICS팀

해커들이 우크라이나에서 정전 사태를 발생시켰던 원인이 되는 차단기를 여는데 물리적으로 개입한 것으로 알려졌다. 이미지 출처 : IDGNS 지난해 12월 우크라이나의 전력회사들에 대한 사이버공격이 있었으며 여기서 악성코드가 직접 정전을 일으킨 것은 아니라는 조사 보고서가 발표됐다. 우크라이나의 정전으로 최소 8만 명이 영향을 받은 것으로 파악됐다. 9일 SANS 산업용 제어시스템(ICS)팀이 공개한 정보에 따르면, 악성코드는 전원을 끄는 회로 차단기를 해커들이 열 수 있도록 네트워크 접근 키를 위한 발판을 제공했다. 전문가들은 수년 동안 유틸리티 회사가 사용하는 산업용 제어시스템이 사이버 공격에 취약하다고 경고했었다. 지난 12월 23일 우크라이나에서 발생한 정전은 바로 그 경고가 현실이 됐음을 보여주는 사례다. SANS ICS는 이 공격 계획이 실행됐다고 밝혔다. 2014년 러시아가 크림을 합병한 이후 우크라이나와 러시아간의 긴장감이 높아졌다.   네트워크 접근권한을 얻는데 악성코드가 이용됐으며 공격자는 전력 시스템 사업자에게 자신들의 행동을 감추기 위해 직접적인 개입을 사용했다고 SANS ICS는 전했다. 이밖에도 정전 영향을 받은 고객들의 항의 전화를 유틸리티 회사가 받지 못하도록 전화시스템에 서비스 거부 공격을 실행하기도 했다고 SANS ICS는 밝혔다. 이 공격은 2개의 서비스 회사(Prykarpattyaoblenergo과 Kyivoblenergo)에 영향을 끼쳤으며 30곳의 변전소가 오프라인 상태가 된 후에 8만 고객들에게 서비스를 업데이트했다고 SANS ICS는 설명했다. 일부 보안업체들은 이 공격에 악용된 블랙 에너지 3라는 악성코드 프로그램과 킬디스크(KillDisk)라는 컴포넌트를 분석했다. 지난 7일 미국 달라스에 있는 보안업체인 아이사이트파트너(iSight Partners)는 ‘샌드웜팀(Sandworm Team)이라는 별명을 사용하며 강한 러시아에 관심을 갖고 있는 ...

정전 변전소 ICS SANS 산업용 제어시스템 발전소 러시아 사이버공격 악성코드 유틸리티 공격 시만텍 전력 해커 우크라이나

2016.01.11

해커들이 우크라이나에서 정전 사태를 발생시켰던 원인이 되는 차단기를 여는데 물리적으로 개입한 것으로 알려졌다. 이미지 출처 : IDGNS 지난해 12월 우크라이나의 전력회사들에 대한 사이버공격이 있었으며 여기서 악성코드가 직접 정전을 일으킨 것은 아니라는 조사 보고서가 발표됐다. 우크라이나의 정전으로 최소 8만 명이 영향을 받은 것으로 파악됐다. 9일 SANS 산업용 제어시스템(ICS)팀이 공개한 정보에 따르면, 악성코드는 전원을 끄는 회로 차단기를 해커들이 열 수 있도록 네트워크 접근 키를 위한 발판을 제공했다. 전문가들은 수년 동안 유틸리티 회사가 사용하는 산업용 제어시스템이 사이버 공격에 취약하다고 경고했었다. 지난 12월 23일 우크라이나에서 발생한 정전은 바로 그 경고가 현실이 됐음을 보여주는 사례다. SANS ICS는 이 공격 계획이 실행됐다고 밝혔다. 2014년 러시아가 크림을 합병한 이후 우크라이나와 러시아간의 긴장감이 높아졌다.   네트워크 접근권한을 얻는데 악성코드가 이용됐으며 공격자는 전력 시스템 사업자에게 자신들의 행동을 감추기 위해 직접적인 개입을 사용했다고 SANS ICS는 전했다. 이밖에도 정전 영향을 받은 고객들의 항의 전화를 유틸리티 회사가 받지 못하도록 전화시스템에 서비스 거부 공격을 실행하기도 했다고 SANS ICS는 밝혔다. 이 공격은 2개의 서비스 회사(Prykarpattyaoblenergo과 Kyivoblenergo)에 영향을 끼쳤으며 30곳의 변전소가 오프라인 상태가 된 후에 8만 고객들에게 서비스를 업데이트했다고 SANS ICS는 설명했다. 일부 보안업체들은 이 공격에 악용된 블랙 에너지 3라는 악성코드 프로그램과 킬디스크(KillDisk)라는 컴포넌트를 분석했다. 지난 7일 미국 달라스에 있는 보안업체인 아이사이트파트너(iSight Partners)는 ‘샌드웜팀(Sandworm Team)이라는 별명을 사용하며 강한 러시아에 관심을 갖고 있는 ...

2016.01.11

IT시스템 정전에 따른 평균 비용 '690만 파운드'··· 컴퓨웨어 조사

최근 3개월 동안 대기업의 절반이 심각한 IT시스템 정전 사태를 경험한 것으로 조사됐다. 컴퓨터웨어의 조사에 따르면, IT 결함으로 기업의 절반 이상이 평균 690만 파운드의 비용을 치른 것으로 나타났다. 시장조사 기업 인텔리트렌드(Intellitrends)가 컴퓨웨어의 의뢰를 받아 유럽과 다른 지역 기업들의 IT 및 현업 임원 304명을 대상으로 조사한 결과로, 응답자의 51%는 최근 3개월 동안 ‘심각한 IT시스템 중단 문제’를 경험한 적이 있으며 79%는 지난 해에 적어도 1번 이상의 문제를 겪은 것으로 답했다. 또한, 3/4인 75%는 IT 문제 발생의 빈도수가 지난해와 비슷하거나 늘어났다고 밝혔다. 조사에 따르면, 이러한 시스템 중단의 영향에 따른 단기 비용으로 평균 690만 파운드가 소요되며 이는 기업에게 상당한 부담으로 나타났다. 여기에는 제품 폐기 비용 50만 4000파운드, 제품 리콜 200만 파운드, 영업 및 마케팅 830만 파운드 등이 포함된다. 시스템 다운에 대한 대응방법으로 새로운 하드웨어와 소프트웨어에 투자하는 것이 일반적인 것으로 조사됐다. 응답자의 51%는 하드웨어와 소프트웨어를 시스템 중단 사태와 관련있다고 말했다. 전력 문제와 보안 위협이라는 답변도 각각 22%와 16%로 집계됐다. 시스템 중단 사태에 대해 두 번째로 잘 알려진 대응방법은 IT교육을 개선하는 것이며, 이는 IT직원(24%)보다는 현업 임원(35%)들이 이 방법을 좀더 선호하는 것으로 나타났다. 이 보고서는 최근에 많은 IT 정전 사태가 발생했음을 보여주며, 특히 많은 IT관련 문제가 잇따랐던 금융 산업만의 문제가 아니었음을 보여줬다. 지난해 경력직들의 어설픈 소프트웨어 업데이트로 약 1억 7,500만 파운드의 RBS가 소요됐으며 이는 수백만 명의 고객들이 계정이 접근하지 못하도록 했다. 최근 로이드은행 그룹은 서비스 출범 당일에 TBS의 인터넷뱅킹 서비스가 다운된 일로 라우터 문제를 지적했다. 컴퓨...

조사 정전 컴퓨웨어 시스템 중단

2013.09.23

최근 3개월 동안 대기업의 절반이 심각한 IT시스템 정전 사태를 경험한 것으로 조사됐다. 컴퓨터웨어의 조사에 따르면, IT 결함으로 기업의 절반 이상이 평균 690만 파운드의 비용을 치른 것으로 나타났다. 시장조사 기업 인텔리트렌드(Intellitrends)가 컴퓨웨어의 의뢰를 받아 유럽과 다른 지역 기업들의 IT 및 현업 임원 304명을 대상으로 조사한 결과로, 응답자의 51%는 최근 3개월 동안 ‘심각한 IT시스템 중단 문제’를 경험한 적이 있으며 79%는 지난 해에 적어도 1번 이상의 문제를 겪은 것으로 답했다. 또한, 3/4인 75%는 IT 문제 발생의 빈도수가 지난해와 비슷하거나 늘어났다고 밝혔다. 조사에 따르면, 이러한 시스템 중단의 영향에 따른 단기 비용으로 평균 690만 파운드가 소요되며 이는 기업에게 상당한 부담으로 나타났다. 여기에는 제품 폐기 비용 50만 4000파운드, 제품 리콜 200만 파운드, 영업 및 마케팅 830만 파운드 등이 포함된다. 시스템 다운에 대한 대응방법으로 새로운 하드웨어와 소프트웨어에 투자하는 것이 일반적인 것으로 조사됐다. 응답자의 51%는 하드웨어와 소프트웨어를 시스템 중단 사태와 관련있다고 말했다. 전력 문제와 보안 위협이라는 답변도 각각 22%와 16%로 집계됐다. 시스템 중단 사태에 대해 두 번째로 잘 알려진 대응방법은 IT교육을 개선하는 것이며, 이는 IT직원(24%)보다는 현업 임원(35%)들이 이 방법을 좀더 선호하는 것으로 나타났다. 이 보고서는 최근에 많은 IT 정전 사태가 발생했음을 보여주며, 특히 많은 IT관련 문제가 잇따랐던 금융 산업만의 문제가 아니었음을 보여줬다. 지난해 경력직들의 어설픈 소프트웨어 업데이트로 약 1억 7,500만 파운드의 RBS가 소요됐으며 이는 수백만 명의 고객들이 계정이 접근하지 못하도록 했다. 최근 로이드은행 그룹은 서비스 출범 당일에 TBS의 인터넷뱅킹 서비스가 다운된 일로 라우터 문제를 지적했다. 컴퓨...

2013.09.23

데이터센터 정전 원인은 '노후 기술'

최근 발표된 조사에 따르면, 사용자의 경험과 생산성의 수준에 미칠 수 있는 영향이 큰데도 불구하고 많은 기업들이 여전히 노후 데이터센터 인프라에 의존하는 것으로 나타났다. 브로케이드의 의뢰를 받아 밴슨본(Vanson Bourne)이 전세계 1,750명의 IT의사결정권자들을 대상으로 수행한 조사 결과, 많은 기업들이 무려 20년 동안이나 동일한 데이터센터 기술을 사용해온 것으로 밝혀졌다. 이 조사에서 가상화와 클라우드 컴퓨팅의 요구 사항을 충족하고자 한다면, 자사 네트워크에서 상당수의 인프라를 업그레이드해야 한다고 답한 IT의사결정권자가 무려 91%나 됐다. 브로케이드는 기업들이 오늘날의 컴퓨팅 환경의 부담을 해결하려면 데이터센터의 가동 시간을 개선하기 위해 패브릭 기반 네트워크를 도입해야 한다고 말했다. 브로케이드의 시스템 엔지니어링 담당 이사 사이먼 팜플린은 " 패브릭 솔루션은 자동 형성, 자동 집계, 자동 치유 기능을 가지고 있어 네트워크가 자동으로 접근과 가동시간을 보장하기 위해 취약점에 대해 자동으로 작동한다. 이 취약점은 사용자가 성능에서 차이를 알아차리지 못해도 수정될 수 있다”라고 말했다. 응답자의 1/3은 매주 여러 네트워크 장애를 경험한다고 말했으며 41%는 네트워크 중단으로 매출 감소나 SLA 위반, 도는 고객 신뢰 감소 같은 금전적인 손실을 입었다고 밝혔다. 한편, 패브릭 기반 네트워크를 사용한다고 답한 IT의사결정권자들은 18%에 불과했으며 내년에 패브릭 네트워크를 도입할 계획이라도 말한 응답자들은 51%로 집계됐다. 이밖에 이 조사에서는 많은 기업들이 실시간 정보에 더 나은 접근을 제공하고 가용성/서비스 전달을 개선하며, 생산성을 높이고자 향후 3년 이내에 소프트웨어 정의 네트워크(SDN)를 도입할 계획인 것으로 나타났다. 팜플린은 기본 네트워크 SDN을 지원할 수 있어야 한다고 말했다. ciokr@idg.co.kr

데이터센터 정전 브로케이드 노후 기술

2013.07.11

최근 발표된 조사에 따르면, 사용자의 경험과 생산성의 수준에 미칠 수 있는 영향이 큰데도 불구하고 많은 기업들이 여전히 노후 데이터센터 인프라에 의존하는 것으로 나타났다. 브로케이드의 의뢰를 받아 밴슨본(Vanson Bourne)이 전세계 1,750명의 IT의사결정권자들을 대상으로 수행한 조사 결과, 많은 기업들이 무려 20년 동안이나 동일한 데이터센터 기술을 사용해온 것으로 밝혀졌다. 이 조사에서 가상화와 클라우드 컴퓨팅의 요구 사항을 충족하고자 한다면, 자사 네트워크에서 상당수의 인프라를 업그레이드해야 한다고 답한 IT의사결정권자가 무려 91%나 됐다. 브로케이드는 기업들이 오늘날의 컴퓨팅 환경의 부담을 해결하려면 데이터센터의 가동 시간을 개선하기 위해 패브릭 기반 네트워크를 도입해야 한다고 말했다. 브로케이드의 시스템 엔지니어링 담당 이사 사이먼 팜플린은 " 패브릭 솔루션은 자동 형성, 자동 집계, 자동 치유 기능을 가지고 있어 네트워크가 자동으로 접근과 가동시간을 보장하기 위해 취약점에 대해 자동으로 작동한다. 이 취약점은 사용자가 성능에서 차이를 알아차리지 못해도 수정될 수 있다”라고 말했다. 응답자의 1/3은 매주 여러 네트워크 장애를 경험한다고 말했으며 41%는 네트워크 중단으로 매출 감소나 SLA 위반, 도는 고객 신뢰 감소 같은 금전적인 손실을 입었다고 밝혔다. 한편, 패브릭 기반 네트워크를 사용한다고 답한 IT의사결정권자들은 18%에 불과했으며 내년에 패브릭 네트워크를 도입할 계획이라도 말한 응답자들은 51%로 집계됐다. 이밖에 이 조사에서는 많은 기업들이 실시간 정보에 더 나은 접근을 제공하고 가용성/서비스 전달을 개선하며, 생산성을 높이고자 향후 3년 이내에 소프트웨어 정의 네트워크(SDN)를 도입할 계획인 것으로 나타났다. 팜플린은 기본 네트워크 SDN을 지원할 수 있어야 한다고 말했다. ciokr@idg.co.kr

2013.07.11

최근 5개월 동안 정전으로 인한 웹 서비스 중단 '9천 번'

중단 분석(Outage Analyzer)은 지난 5개월 동안 전 세계적으로 1,413건의 정전 사태가 있었으며 부분 정전은 약 8,000건으로 파악했다. ‘404 오류’ 또는 트위터의 ‘실패 고래(Fail Whale)’가 실제로 온라인 활동을 죽일 수 있다. 중단 분석이 최근 자료에 따르면, 이러한 종류의 서비스 중단이 날마다 인터넷에서 발생하고 있다. 무료 인터넷 서비스의 추적 결과, 최근 5개월 동안 1,413건의 정전 사태가 발생했으며 이는 하루 5번 꼴이고 부분적인 정전은 약 8,000건에 달했으며 이는 하루 53번 꼴이다. 정전 사태는 웹 서비스를 전혀 사용할 수 없는 상황이며 서비스 사용자의 일부만 영향을 받는다면 부분적인 정전으로 간주했다. 중단 분석을 운영하는 APM 업체 컴퓨웨어의 제품 마케팅 이사 벤 그루빈은 “이전 보고서보다 빈도수는 줄어들었다”고 말했다. 하지만 1시간 이상 연결이 안된다면, 이 추이는 사용자를 다소 불편하게 할 가능성이 높다. 서비스 자체가 중단되면 가장 큰 관심을 얻을 수 있지만, 일부 서비스 중단은 다른 사람들이 서비스를 이용하는 동안 개별 웹과 모바일 트랜잭션에 제한적으로 영향을 끼치면서 발생할 가능성이 더 높다고 중단 분석은 보고서에 설명했다. 그루빈은 휴대전화 사용자뿐 아니라 이러한 중단은 온라인 사용자에도 영향을 준다고 말했다. "대부분의 사람들은 자신의 휴대전화에서 작동하는 모바일 애플리케이션에 대해 생각하지만, 대부분의 모바일 애플리케이션은 그냥 아무것도 아닌, 인터넷을 통해 웹 서비스에 연결하고 있다"라고 그루빈은 밝혔다. "그래서 스토리지 서비스, 광고 서비스, 분석 서비스 등에서의 중단은 소비자의 휴대폰에서 실행중인 애플리케이션에 영향을 미칠 수 있다"라고 그는 덧붙였다. 아카마이의 제품군 담당 이사이자 아카마이 인터넷 현황 보고서 필자인 데이빗 벨슨은 서비...

트위터 정전 서비스 중단 오류 컴퓨웨어 중단 분석

2013.05.28

중단 분석(Outage Analyzer)은 지난 5개월 동안 전 세계적으로 1,413건의 정전 사태가 있었으며 부분 정전은 약 8,000건으로 파악했다. ‘404 오류’ 또는 트위터의 ‘실패 고래(Fail Whale)’가 실제로 온라인 활동을 죽일 수 있다. 중단 분석이 최근 자료에 따르면, 이러한 종류의 서비스 중단이 날마다 인터넷에서 발생하고 있다. 무료 인터넷 서비스의 추적 결과, 최근 5개월 동안 1,413건의 정전 사태가 발생했으며 이는 하루 5번 꼴이고 부분적인 정전은 약 8,000건에 달했으며 이는 하루 53번 꼴이다. 정전 사태는 웹 서비스를 전혀 사용할 수 없는 상황이며 서비스 사용자의 일부만 영향을 받는다면 부분적인 정전으로 간주했다. 중단 분석을 운영하는 APM 업체 컴퓨웨어의 제품 마케팅 이사 벤 그루빈은 “이전 보고서보다 빈도수는 줄어들었다”고 말했다. 하지만 1시간 이상 연결이 안된다면, 이 추이는 사용자를 다소 불편하게 할 가능성이 높다. 서비스 자체가 중단되면 가장 큰 관심을 얻을 수 있지만, 일부 서비스 중단은 다른 사람들이 서비스를 이용하는 동안 개별 웹과 모바일 트랜잭션에 제한적으로 영향을 끼치면서 발생할 가능성이 더 높다고 중단 분석은 보고서에 설명했다. 그루빈은 휴대전화 사용자뿐 아니라 이러한 중단은 온라인 사용자에도 영향을 준다고 말했다. "대부분의 사람들은 자신의 휴대전화에서 작동하는 모바일 애플리케이션에 대해 생각하지만, 대부분의 모바일 애플리케이션은 그냥 아무것도 아닌, 인터넷을 통해 웹 서비스에 연결하고 있다"라고 그루빈은 밝혔다. "그래서 스토리지 서비스, 광고 서비스, 분석 서비스 등에서의 중단은 소비자의 휴대폰에서 실행중인 애플리케이션에 영향을 미칠 수 있다"라고 그는 덧붙였다. 아카마이의 제품군 담당 이사이자 아카마이 인터넷 현황 보고서 필자인 데이빗 벨슨은 서비...

2013.05.28

아마존닷컴 정전, 아마존에게서 한 시간이란...500만 달러

수십억 달러의 온라인 소매 웹사이트인 아마존닷컴은 31일 미 동부시각 오후 3시(한국 시각 1일 오전 5시) 원인불상의 정전을 경험했다.     아마존닷컴 정전에 대한 소문은 약 오후 2시 40분에 트위터에 튀어나오기 시작했다. 이 사이트에 여러 차례 접속을 시도했지만 3시 15분까지 'Http/1.1 Service Unavailable'이라는 메시지만 볼 수 있었다. 일부 사용자들에게는 오후 3시 30분까지 접속할 수 없었다.   아마존의 가장 큰 고객은 자사의 클라우드 부서인 AWS(Amazon Web Services)다. AWS는 지난 3년동안 다양한 정전 사태를 경험했지만 아마존닷컴 상세 사이트에는 영향이 미치지 않았다.   2012년 10월 아마존 엘라스틱 블록 스토리지 정전은 레딧과 같은 고객들을 넉다운시켰다. 또한 2012년 크리스마스 이브날 정전은 스트리밍 영화 서비스인 넷플릭스를 다운시켰다. 그래도 아마존닷컴은 아니었다.   이번 사례는 아마존닷컴이 단순히 다운됐다는 것을 의미하는 것이 아니라 AWS의 클라우드 부문의 상태 보고서 페이지에서 어떤 문제도 볼 수 없었다는 점이다.   이날 오후 www.downforeveryoneorjustme.com 사이트는 아마존닷컴이 다운됐음을 확인했다.   최근 아마존닷컴은 분기당 약 108억 달러, 하루 1억 1,800만 달러, 시간당으로는 490만 달러의 매출을 기록했다.   한편 소셜 네트워크 사이트 트위터는 이보다 일찍 같은 문제를 접했지만 서비스는 빨리 복구됐다. editor@itworld.co.kr

정전 아마존닷컴 500만 달러

2013.02.01

수십억 달러의 온라인 소매 웹사이트인 아마존닷컴은 31일 미 동부시각 오후 3시(한국 시각 1일 오전 5시) 원인불상의 정전을 경험했다.     아마존닷컴 정전에 대한 소문은 약 오후 2시 40분에 트위터에 튀어나오기 시작했다. 이 사이트에 여러 차례 접속을 시도했지만 3시 15분까지 'Http/1.1 Service Unavailable'이라는 메시지만 볼 수 있었다. 일부 사용자들에게는 오후 3시 30분까지 접속할 수 없었다.   아마존의 가장 큰 고객은 자사의 클라우드 부서인 AWS(Amazon Web Services)다. AWS는 지난 3년동안 다양한 정전 사태를 경험했지만 아마존닷컴 상세 사이트에는 영향이 미치지 않았다.   2012년 10월 아마존 엘라스틱 블록 스토리지 정전은 레딧과 같은 고객들을 넉다운시켰다. 또한 2012년 크리스마스 이브날 정전은 스트리밍 영화 서비스인 넷플릭스를 다운시켰다. 그래도 아마존닷컴은 아니었다.   이번 사례는 아마존닷컴이 단순히 다운됐다는 것을 의미하는 것이 아니라 AWS의 클라우드 부문의 상태 보고서 페이지에서 어떤 문제도 볼 수 없었다는 점이다.   이날 오후 www.downforeveryoneorjustme.com 사이트는 아마존닷컴이 다운됐음을 확인했다.   최근 아마존닷컴은 분기당 약 108억 달러, 하루 1억 1,800만 달러, 시간당으로는 490만 달러의 매출을 기록했다.   한편 소셜 네트워크 사이트 트위터는 이보다 일찍 같은 문제를 접했지만 서비스는 빨리 복구됐다. editor@itworld.co.kr

2013.02.01

인도 대규모 정전 사태가 아웃소싱 업체에 주는 교훈

인도 북서부에 있는 IT서비스 업체들은 대규모 정전 사태의 영향을 크게 받지 않은 것으로 알려졌다. 이 정전은 6만 여명의 업무에 불편을 끼친 것으로 파악된다. 하지만 글로벌 전력 부족 사태가 앞으로 일어날 가능성을 고려한다면, 아웃소싱 업체가 어디에 있건 간 기업은 스스로를 보호하기 위한 준비가 필요하다.   아웃소싱 컨설팅 회사인 ISG의 파트너 스티브 홀은 "인도의 서비스 제공업체들은 국제 통신망 단절, 대규모 파업 등 대규모 우발 사태에 대한 경험이 많아 준비 역시 일반적으로 잘돼 있다"라고 언급했다. KPMG 컨설팅 서비스 부문의 연구 담당 이사 스탄 레피크 역시 "정전 사고가 새로울 것은 없다"라고 말했다. 그러나 "최근 사고는 규모가 유독 컸다"라고 덧붙였다. 인도 남부의 방갈로르가 여전히 인도 IT아웃소싱 산업의 수도와 같은 역할을 하고 있지만, 대부분의 주요 서비스 제공업체들이 북부의 대도시인 델리에 사업 기반을 가지고 있으며, HCL 테크놀로지스(HCL Techologies), CSC는 인근 노이다(Noida)에 본사를, IBM 글로벌 서비스는 이곳에 데이터센터를 두고 있다. 티어 원 및 티어 투 업체들은 백업 계획에 상당한 자본을 투자하고 있다. ISG의 홀에 따르면, 정전 사고가 발생해도 최소 5~7일간 운영이 가능하다. 대부분의 시설이 디젤 발전기와 수력 발전기 등 발전 시설을 갖추고 있기 때문이다. 아웃소싱 컨설팅 회사인 HfS 리서치(HfS Research)의 연구 담당 이사 짐 슬래비는 "이들 업체들의 주요 시설은 개별적으로 운영할 수 있도록 구축돼 있다. 또 특정 시설의 서비스 중단 사태가 장기화될 경우, 백업 시설로 직원들을 재배치하는 긴급 사태 대책을 갖추고 있다. 또 폭동이나 자연재해 같은 사고 시 물리적 보안을 강화할 능력도 있다"라고 설명했다. 정전에 영향을 받는 인프라와 ...

SLA 재해복구 인도 정전 비즈니스 연속성 BCS

2012.08.06

인도 북서부에 있는 IT서비스 업체들은 대규모 정전 사태의 영향을 크게 받지 않은 것으로 알려졌다. 이 정전은 6만 여명의 업무에 불편을 끼친 것으로 파악된다. 하지만 글로벌 전력 부족 사태가 앞으로 일어날 가능성을 고려한다면, 아웃소싱 업체가 어디에 있건 간 기업은 스스로를 보호하기 위한 준비가 필요하다.   아웃소싱 컨설팅 회사인 ISG의 파트너 스티브 홀은 "인도의 서비스 제공업체들은 국제 통신망 단절, 대규모 파업 등 대규모 우발 사태에 대한 경험이 많아 준비 역시 일반적으로 잘돼 있다"라고 언급했다. KPMG 컨설팅 서비스 부문의 연구 담당 이사 스탄 레피크 역시 "정전 사고가 새로울 것은 없다"라고 말했다. 그러나 "최근 사고는 규모가 유독 컸다"라고 덧붙였다. 인도 남부의 방갈로르가 여전히 인도 IT아웃소싱 산업의 수도와 같은 역할을 하고 있지만, 대부분의 주요 서비스 제공업체들이 북부의 대도시인 델리에 사업 기반을 가지고 있으며, HCL 테크놀로지스(HCL Techologies), CSC는 인근 노이다(Noida)에 본사를, IBM 글로벌 서비스는 이곳에 데이터센터를 두고 있다. 티어 원 및 티어 투 업체들은 백업 계획에 상당한 자본을 투자하고 있다. ISG의 홀에 따르면, 정전 사고가 발생해도 최소 5~7일간 운영이 가능하다. 대부분의 시설이 디젤 발전기와 수력 발전기 등 발전 시설을 갖추고 있기 때문이다. 아웃소싱 컨설팅 회사인 HfS 리서치(HfS Research)의 연구 담당 이사 짐 슬래비는 "이들 업체들의 주요 시설은 개별적으로 운영할 수 있도록 구축돼 있다. 또 특정 시설의 서비스 중단 사태가 장기화될 경우, 백업 시설로 직원들을 재배치하는 긴급 사태 대책을 갖추고 있다. 또 폭동이나 자연재해 같은 사고 시 물리적 보안을 강화할 능력도 있다"라고 설명했다. 정전에 영향을 받는 인프라와 ...

2012.08.06

마이크로소프트, 유럽의 클라우드 정전 사태로 진땀

마이크로소프트가 최근 유럽에서 발생한 자사의 애저 클라우드 컴퓨팅 서비스 중단 사태를 해결했다고 밝혔다. 지난 주 목요일 2시간 이상 동안 유럽의 사용자들이 정전으로 애저 클랑드 컴퓨팅 서비스를 이용하지 못한 것으로 알려졌다. 마이크로소프트는 정전의 원인에 대해 구체적으로 밝히지 않았으며 처음에는 오전 11시(미국 동부 기준) 이후 이 문제를 간략하게 보고하고 오후 1시 반 이후 복구될 것이라고 자사 애저 서비스 블로그를 통해 말했다. 마이크로소프트는 서비스 중단이 호스팅 서비스에는 영향을 끼치지만 스토지리 계정이나 애플리케이션 운영은 영향을 받지 않을 것이라고 전했다. 마이크로소프트는 올 2월 29일 ‘도약의 날’에 애저 정전으로 영향을 받은 고객들에게 크레딧을 제공했다. 소프트웨어 버그는 코드를 공개했는데, 도약의 날 행사가 4년마다 소프트웨어 버그가 잘못됐다고 인정하는 시스템 때문에 개최된다 해도, 소프트웨어의 버그가 올해 도약의 날을 개최한 주된 목적은 아니었다. 이번 애저 문제는 해결하는 데 13시간이 걸렸다. 지금의 애저 문제는 목요일에 발생한 여러 가지 정전 중 하나일 뿐이다. 구글 토크 사용자들은 영향을 정전에 대해 트위터에서 사용자 대부분이 정전의 영향을 받았다고 불평했다고 마이크로소프트는 전했다. 트위터 자체가 정오 무렵 정전으로 중단됐을 때 이러한 불평들은 소셜 미디어 네트워크에서 잠잠해졌다. 한편, 마이크로소프트 이외에 다른 클라우드 컴퓨팅 제공 업체로는 세일즈포스닷컴과 아마존 웹 서비스(AWS)가 최근 몇 개월 동안 이 같은 서비스 중단 사태를 경험했다. ciokr@idg.co.kr

클라우드 마이크로소프트 트위터 애저 정전 중단 유럽

2012.07.30

마이크로소프트가 최근 유럽에서 발생한 자사의 애저 클라우드 컴퓨팅 서비스 중단 사태를 해결했다고 밝혔다. 지난 주 목요일 2시간 이상 동안 유럽의 사용자들이 정전으로 애저 클랑드 컴퓨팅 서비스를 이용하지 못한 것으로 알려졌다. 마이크로소프트는 정전의 원인에 대해 구체적으로 밝히지 않았으며 처음에는 오전 11시(미국 동부 기준) 이후 이 문제를 간략하게 보고하고 오후 1시 반 이후 복구될 것이라고 자사 애저 서비스 블로그를 통해 말했다. 마이크로소프트는 서비스 중단이 호스팅 서비스에는 영향을 끼치지만 스토지리 계정이나 애플리케이션 운영은 영향을 받지 않을 것이라고 전했다. 마이크로소프트는 올 2월 29일 ‘도약의 날’에 애저 정전으로 영향을 받은 고객들에게 크레딧을 제공했다. 소프트웨어 버그는 코드를 공개했는데, 도약의 날 행사가 4년마다 소프트웨어 버그가 잘못됐다고 인정하는 시스템 때문에 개최된다 해도, 소프트웨어의 버그가 올해 도약의 날을 개최한 주된 목적은 아니었다. 이번 애저 문제는 해결하는 데 13시간이 걸렸다. 지금의 애저 문제는 목요일에 발생한 여러 가지 정전 중 하나일 뿐이다. 구글 토크 사용자들은 영향을 정전에 대해 트위터에서 사용자 대부분이 정전의 영향을 받았다고 불평했다고 마이크로소프트는 전했다. 트위터 자체가 정오 무렵 정전으로 중단됐을 때 이러한 불평들은 소셜 미디어 네트워크에서 잠잠해졌다. 한편, 마이크로소프트 이외에 다른 클라우드 컴퓨팅 제공 업체로는 세일즈포스닷컴과 아마존 웹 서비스(AWS)가 최근 몇 개월 동안 이 같은 서비스 중단 사태를 경험했다. ciokr@idg.co.kr

2012.07.30

아마존의 정전 사태, 고객에겐 잘못이 없을까?

지난 6월, 두 차례의 정전 사고로 아마존 웹 서비스(AWS)의 기업 고객들인 인스타그램(Instagram), 핀터레스트(Pinterest), 넷플릭스(Netflix) 등이 자사의 고객 서비스 지원에 어려움을 겪어야 했다. 그런데, 이 AWS의 고객들에겐 아무런 책임이 없는 것일까? 글로벌 IaaS 업체 오스페로(Ospero)의 설립자 겸 CEO 제이슨 커릴은 “책임은 양 측 모두에게 있다. 우선 아마존은, 예비 전력의 문제를 보다 신중히 검토해야 할 필요성을 느꼈을 것이다. 이와 관련한 이슈는 첫 번째 정전 사고 이후 이미 제기된 것이다. 예비 전력은 데이터센터가 철저하게 검토해야 하는 기본 중의 기본이다”라고 설명했다. '클라우드는 유틸리티다' 커릴은 AWS 클라이언트들에게도 일부 책임이 있다는 점을 강조했다. 자신들의 고객들이 서비스를 이용하는데 불편을 초래했기 때문이다. 그는 “당신 기업의 본사 건물 지하엔 정전에 대비한 디젤 발전기가 설치돼 있지 않나? 통신선은? 건물로 이어지는 통신선은 아마도 두 개로 나눠져 있을 것이다. 둘 중 하나에 문제가 발생해도 커뮤니케이션이 가능하도록 말이다. 그런데 클라우드에는 왜 이런 노력을 하지 않는가? 클라우드 역시 일종의 유틸리티다. 예비 클라우드를 마련하라”고 강조했다. 발전기의 정지와 소프트웨어 버그가 문제를 유발 6월 29일 발생한 두 번째 서비스 중단 사고 이후 발표된 사후 보고서에서 아마존 측은 일련의 정전 사태와 발전기의 문제, 그리고 백로그(backlog) 재부팅으로 인해 ‘많은 고객들에게 막대한 손실을 끼치게 되었다고 설명했다. 문제는 미 동부에 불어 닥친 폭풍의 영향으로 노스버지니아 지역에 정전 사태가 발생하며 시작됐다. 아마존은 이 지역에 복수의 가용성 존(availability)으로 구성된 10 개 이상의 데이터센터를 갖추고 있다. 이러한 구조는 분명 지난 29일의 사태와 같은...

SLA 아마존 AWS 정전 멀티벤더

2012.07.17

지난 6월, 두 차례의 정전 사고로 아마존 웹 서비스(AWS)의 기업 고객들인 인스타그램(Instagram), 핀터레스트(Pinterest), 넷플릭스(Netflix) 등이 자사의 고객 서비스 지원에 어려움을 겪어야 했다. 그런데, 이 AWS의 고객들에겐 아무런 책임이 없는 것일까? 글로벌 IaaS 업체 오스페로(Ospero)의 설립자 겸 CEO 제이슨 커릴은 “책임은 양 측 모두에게 있다. 우선 아마존은, 예비 전력의 문제를 보다 신중히 검토해야 할 필요성을 느꼈을 것이다. 이와 관련한 이슈는 첫 번째 정전 사고 이후 이미 제기된 것이다. 예비 전력은 데이터센터가 철저하게 검토해야 하는 기본 중의 기본이다”라고 설명했다. '클라우드는 유틸리티다' 커릴은 AWS 클라이언트들에게도 일부 책임이 있다는 점을 강조했다. 자신들의 고객들이 서비스를 이용하는데 불편을 초래했기 때문이다. 그는 “당신 기업의 본사 건물 지하엔 정전에 대비한 디젤 발전기가 설치돼 있지 않나? 통신선은? 건물로 이어지는 통신선은 아마도 두 개로 나눠져 있을 것이다. 둘 중 하나에 문제가 발생해도 커뮤니케이션이 가능하도록 말이다. 그런데 클라우드에는 왜 이런 노력을 하지 않는가? 클라우드 역시 일종의 유틸리티다. 예비 클라우드를 마련하라”고 강조했다. 발전기의 정지와 소프트웨어 버그가 문제를 유발 6월 29일 발생한 두 번째 서비스 중단 사고 이후 발표된 사후 보고서에서 아마존 측은 일련의 정전 사태와 발전기의 문제, 그리고 백로그(backlog) 재부팅으로 인해 ‘많은 고객들에게 막대한 손실을 끼치게 되었다고 설명했다. 문제는 미 동부에 불어 닥친 폭풍의 영향으로 노스버지니아 지역에 정전 사태가 발생하며 시작됐다. 아마존은 이 지역에 복수의 가용성 존(availability)으로 구성된 10 개 이상의 데이터센터를 갖추고 있다. 이러한 구조는 분명 지난 29일의 사태와 같은...

2012.07.17

아마존 정전 사고 1년, 클라우드 안전성을 생각한다

전문가들은 기업이 IT업체들의 정전 사태에서 안전하려면, 스스로 이를 점검하지 않으면 안된다고 경고했다. 지난해 4월 아마존 웹 서비스 중단 사고가 발생한 지 1년이 지났다. 당시로서는 역대 최악의 클라우드 서비스 중단 사고였다. 레디트(Reddit), 포스퀘어(Foursquare), 훗스위트(HootSuite), 쿠오라(Quora) 등 대형 고객들이 많게는 4일간 서비스를 사용하지 못했다. 그렇다면 1년이 지난 지금, 선도적인 IaaS 및 클라우드 서비스 제공업체들은 이런 대형 사고를 방지하기 충분할 만큼 변화를 이뤄냈을까? 또 만약 이런 대형 사고가 반복된다면, 기업들은 어떻게 대비를 해야 할까? 전문가들에 따르면, 여기에 대한 대답은 정해져 있지 않다. 부분적으로 이런 질문에 대한 대답이 어려운 이유는 AWS가 방대한 클라우드 운영과 관련해 수행한 내부 작업에 대한 정보를 공개하지 않고 있기 때문이다. 지난해 4월에만 서비스 중단 사고가 있었던 건 아니다. 8월에도 짧은 기간이었지만 서비스가 중단된 적이 있었다. 더 나아가, 클라우드 고객 각자가 어떤 준비를 하고 있는지 파악하기 어렵다. IDC의 스테판 헨드릭 애널리스트 같은 업계 전문가들은 많은 기업들이 제대로 준비를 갖추지 못한 상태라고 말하고 있다. 변화 1 : 기업 스스로 대비책 마련 헨드릭은 1년 전 AWS 서비스 중단 사태를 상기시키며 "일부는 서비스 중단에 대비하고 있다. 그러나 일부는 서비스가 중단되면 큰 타격을 입을게 분명하다. 학습 효과가 있었던 건 확실하다. 그러나 문제는 고객이 스스로를 보호하기 위해 해야 할 일을 하느냐다"라고 지적했다. 먼저, 지난해 사고를 되짚어보자. AWS는 서비스가 중단되고 몇 주 후 발표한 사후 보고서를 통해 사고 원인과 회사가 취한 조치를 설명했다. 기본적으로 사람의 실수가 연쇄반응을 불러왔다. 2011년 4월 21일 이른 아침, AWS 동부 해안 지역의 EBS(Elastic Block S...

SLA 아마존 AWS 정전 중단

2012.05.02

전문가들은 기업이 IT업체들의 정전 사태에서 안전하려면, 스스로 이를 점검하지 않으면 안된다고 경고했다. 지난해 4월 아마존 웹 서비스 중단 사고가 발생한 지 1년이 지났다. 당시로서는 역대 최악의 클라우드 서비스 중단 사고였다. 레디트(Reddit), 포스퀘어(Foursquare), 훗스위트(HootSuite), 쿠오라(Quora) 등 대형 고객들이 많게는 4일간 서비스를 사용하지 못했다. 그렇다면 1년이 지난 지금, 선도적인 IaaS 및 클라우드 서비스 제공업체들은 이런 대형 사고를 방지하기 충분할 만큼 변화를 이뤄냈을까? 또 만약 이런 대형 사고가 반복된다면, 기업들은 어떻게 대비를 해야 할까? 전문가들에 따르면, 여기에 대한 대답은 정해져 있지 않다. 부분적으로 이런 질문에 대한 대답이 어려운 이유는 AWS가 방대한 클라우드 운영과 관련해 수행한 내부 작업에 대한 정보를 공개하지 않고 있기 때문이다. 지난해 4월에만 서비스 중단 사고가 있었던 건 아니다. 8월에도 짧은 기간이었지만 서비스가 중단된 적이 있었다. 더 나아가, 클라우드 고객 각자가 어떤 준비를 하고 있는지 파악하기 어렵다. IDC의 스테판 헨드릭 애널리스트 같은 업계 전문가들은 많은 기업들이 제대로 준비를 갖추지 못한 상태라고 말하고 있다. 변화 1 : 기업 스스로 대비책 마련 헨드릭은 1년 전 AWS 서비스 중단 사태를 상기시키며 "일부는 서비스 중단에 대비하고 있다. 그러나 일부는 서비스가 중단되면 큰 타격을 입을게 분명하다. 학습 효과가 있었던 건 확실하다. 그러나 문제는 고객이 스스로를 보호하기 위해 해야 할 일을 하느냐다"라고 지적했다. 먼저, 지난해 사고를 되짚어보자. AWS는 서비스가 중단되고 몇 주 후 발표한 사후 보고서를 통해 사고 원인과 회사가 취한 조치를 설명했다. 기본적으로 사람의 실수가 연쇄반응을 불러왔다. 2011년 4월 21일 이른 아침, AWS 동부 해안 지역의 EBS(Elastic Block S...

2012.05.02

클라우드 정전 사태를 예방하는 5가지 방법

“모든 것은 항상 실패한다.” 이는 아마존닷컴 CTO 베르너 보켈스의 말이다. 아마존 웹 서비스가 지난해 4월 서비스 중단 사태를 경험했다. 그리고 8월 또 다른 정전으로 인한 서비스 중단이 있었다. 지난해 많은 다른 클라우드 서비스 회사들도 이 같은 사고를 겪었다. 마이크로소프트의 윈도우 애저 클라우드 플랫폼은 2월 29일에 대한 회계 오류로 지난 2월 다운타임 문제를 겪었다. 클라우드 업체들이 앞으로 정전을 최소화하겠다며 서비스를 향상시켰지만, 더 많은 정전 사태가 올해와 앞으로 일어날 것이다. 기업 IT부서가 클라우드 중단 사태를 피하려면 어떠한 준비가 필요할까? 여기 전문가들이 말하는 다섯 가지 팁이 있다. 1) AWS와 함께 다양한 가용성 존을 이용하라 아마존웹서비스는 지역별과 서비스별로 가용성 존(AZ)를 제공하고 있다. 아마존은 자사의 AZ를 물리적으로 거리를 두고 독립적인 인프라에서 각각 운영한다고 설명했다. AZ들은 토네이도, 홍수 등 매우 드문 자연재해와 화재 같은 사고가 하나의 가용성 영역에 영향을 미칠 수 있기 때문에 물리적으로 별개의 인프라로 운영된다"라고 아마존은 전했다. 지난해 정전이 발생했을 때 관계형 데이터베이스 서비스에 대해 단일 AZ를 사용하는 고객의 약 45%가 영향을 받은 반면, 복수 AZ를 사용하는 고객 중 피해를 입은 경우는 3% 미만이었다고 AWS는 분석 보고서에서 밝혔다. 지난해 정전 이후 아마존은 전체 AZ에 걸쳐 인스턴스를 공급할 수 있도록 일반적인 설계와 API를 허용함으로써 기업들이 복수의 AZ로 접근하기 쉽도록 만들었다. 2) AWS를 통해 여러 영역을 사용하라 AWS는 미 동부(북부 버지니아), 미 서부(오레곤), 미 서부(북부 캘리포니아), 유럽(아일랜드), 아시아태평양 지역(싱가포르), 아시아 태평양 지역(도쿄), 남미(상파울로), AWS 정부 클라우드(GovCloud) 등 8개 지역의 네트워크를 보유하고 있다. 기타 보안과 복수 AZ 접근의 보호...

클라우드 정전 예방

2012.04.30

“모든 것은 항상 실패한다.” 이는 아마존닷컴 CTO 베르너 보켈스의 말이다. 아마존 웹 서비스가 지난해 4월 서비스 중단 사태를 경험했다. 그리고 8월 또 다른 정전으로 인한 서비스 중단이 있었다. 지난해 많은 다른 클라우드 서비스 회사들도 이 같은 사고를 겪었다. 마이크로소프트의 윈도우 애저 클라우드 플랫폼은 2월 29일에 대한 회계 오류로 지난 2월 다운타임 문제를 겪었다. 클라우드 업체들이 앞으로 정전을 최소화하겠다며 서비스를 향상시켰지만, 더 많은 정전 사태가 올해와 앞으로 일어날 것이다. 기업 IT부서가 클라우드 중단 사태를 피하려면 어떠한 준비가 필요할까? 여기 전문가들이 말하는 다섯 가지 팁이 있다. 1) AWS와 함께 다양한 가용성 존을 이용하라 아마존웹서비스는 지역별과 서비스별로 가용성 존(AZ)를 제공하고 있다. 아마존은 자사의 AZ를 물리적으로 거리를 두고 독립적인 인프라에서 각각 운영한다고 설명했다. AZ들은 토네이도, 홍수 등 매우 드문 자연재해와 화재 같은 사고가 하나의 가용성 영역에 영향을 미칠 수 있기 때문에 물리적으로 별개의 인프라로 운영된다"라고 아마존은 전했다. 지난해 정전이 발생했을 때 관계형 데이터베이스 서비스에 대해 단일 AZ를 사용하는 고객의 약 45%가 영향을 받은 반면, 복수 AZ를 사용하는 고객 중 피해를 입은 경우는 3% 미만이었다고 AWS는 분석 보고서에서 밝혔다. 지난해 정전 이후 아마존은 전체 AZ에 걸쳐 인스턴스를 공급할 수 있도록 일반적인 설계와 API를 허용함으로써 기업들이 복수의 AZ로 접근하기 쉽도록 만들었다. 2) AWS를 통해 여러 영역을 사용하라 AWS는 미 동부(북부 버지니아), 미 서부(오레곤), 미 서부(북부 캘리포니아), 유럽(아일랜드), 아시아태평양 지역(싱가포르), 아시아 태평양 지역(도쿄), 남미(상파울로), AWS 정부 클라우드(GovCloud) 등 8개 지역의 네트워크를 보유하고 있다. 기타 보안과 복수 AZ 접근의 보호...

2012.04.30

기고 | 아마존 정전에서 얻은 재해복구와 클라우드 교훈

이달 초에 발생한 아마존 클라우드 서비스 사태로 기업의 재해복구 계획 취약점이 확연히 드러났다. 그레고리 마클러는 기업이 정전으로부터 자사를 보호하기 위해 무엇을 고려해야 할 지를 정리했다. 지난 8월7일 일요일 아일랜드 더블린에 있는 아마존의 클라우드 데이터센터에 정전 사고가 발생했다. 이 정전은 더블린 데이터센터 근처의 변압기를 강타한 번개 때문에 발생했다. 이 사고는 모든 데이터센터에 정전을 일으켰던 것은 모든 전기 공급을 중단시킨 폭발과 화재를 초래했다. 아마존은 유럽 지역에 데이터센터를 하나 가지고 있는데 바로 거기서 사고가 발생한 것이다. 이 사고에 대해 첫 번째로 든 생각은 재해복구와 아마존 서비스와 관계다. 아마존은 지난 4월에도 정전이 발생했다. 당시 미국 동부에서 발생한 서비스가 정전으로 네트워크 구성에 변화를 일으켰다. 이 정전 사고로 다른 의문들이 생겼다. 왜 아마존은 디젤 같은 대체 전력 시설을 만들지 않는 걸까? 정전으로 인한 화재는 전기 공급의 상당한 부분을 날려 버렸으며 그 결과 좀더 심각한 재해가 초기 변압기 폭발로 발생했다. 어떻게 이런 것이 가능할 수 있을까? 유럽의 다른 지역에 위치한 서비스에 대한 중단은 어떤가? 다행히 유럽의 다른 지역에 위치한 서비스는 중단되지 않았다. 필자는 당시에 유럽의 데이터센터 건물이 터무니없는 비싸다고 생각했다. 그 점은 아마존이 유럽 데이터센터를 보유하지 않는 이유기도 하다. 정전 이후, 아마존은 상당한 기간 동안 모든 서버를 재가동했다고 언급했다. 마이크로소프트 역시 동일한 데이터센터 서비스를 제공하지만, 이 회사는 아마존처럼 취약하지 않다는 사실도 밝혔다. 필자는 그 이유가 궁금했다. 데이터 복제는 최우선순위에 놓여야 한다. 특히 아마존이 데이터센터 전체에 대한 재해복구 능력이 부족할 때는 더더욱 그렇다. 8월 8일, 아마존은 소프트웨어 에러가 유럽 데이터센터 내 데이터의 복구를 지연시키고 있다고 밝혔다. 이는 비즈니스 연속성 테스트가 부족했다는 점을 지적하는 것...

SLA 클라우드 아마존 데이터센터 정전 전력 공급

2011.08.16

이달 초에 발생한 아마존 클라우드 서비스 사태로 기업의 재해복구 계획 취약점이 확연히 드러났다. 그레고리 마클러는 기업이 정전으로부터 자사를 보호하기 위해 무엇을 고려해야 할 지를 정리했다. 지난 8월7일 일요일 아일랜드 더블린에 있는 아마존의 클라우드 데이터센터에 정전 사고가 발생했다. 이 정전은 더블린 데이터센터 근처의 변압기를 강타한 번개 때문에 발생했다. 이 사고는 모든 데이터센터에 정전을 일으켰던 것은 모든 전기 공급을 중단시킨 폭발과 화재를 초래했다. 아마존은 유럽 지역에 데이터센터를 하나 가지고 있는데 바로 거기서 사고가 발생한 것이다. 이 사고에 대해 첫 번째로 든 생각은 재해복구와 아마존 서비스와 관계다. 아마존은 지난 4월에도 정전이 발생했다. 당시 미국 동부에서 발생한 서비스가 정전으로 네트워크 구성에 변화를 일으켰다. 이 정전 사고로 다른 의문들이 생겼다. 왜 아마존은 디젤 같은 대체 전력 시설을 만들지 않는 걸까? 정전으로 인한 화재는 전기 공급의 상당한 부분을 날려 버렸으며 그 결과 좀더 심각한 재해가 초기 변압기 폭발로 발생했다. 어떻게 이런 것이 가능할 수 있을까? 유럽의 다른 지역에 위치한 서비스에 대한 중단은 어떤가? 다행히 유럽의 다른 지역에 위치한 서비스는 중단되지 않았다. 필자는 당시에 유럽의 데이터센터 건물이 터무니없는 비싸다고 생각했다. 그 점은 아마존이 유럽 데이터센터를 보유하지 않는 이유기도 하다. 정전 이후, 아마존은 상당한 기간 동안 모든 서버를 재가동했다고 언급했다. 마이크로소프트 역시 동일한 데이터센터 서비스를 제공하지만, 이 회사는 아마존처럼 취약하지 않다는 사실도 밝혔다. 필자는 그 이유가 궁금했다. 데이터 복제는 최우선순위에 놓여야 한다. 특히 아마존이 데이터센터 전체에 대한 재해복구 능력이 부족할 때는 더더욱 그렇다. 8월 8일, 아마존은 소프트웨어 에러가 유럽 데이터센터 내 데이터의 복구를 지연시키고 있다고 밝혔다. 이는 비즈니스 연속성 테스트가 부족했다는 점을 지적하는 것...

2011.08.16

IDG 설문조사

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.9