2017.05.30

브리티시 에어웨이, 시스템 장애로 항공기 수백 대 운항 차질

Peter Sayer | IDG News Service
영국의 대형 항공사인 브리티시 에어웨이(British Airways)의 데이터센터 장애 사고는 백업 시스템 테스팅과 계획성 있는 재해복구 절차의 중요성을 잘 보여준다.



업체의 CEO 알렉스 크루즈는 이번 사고를 '핵심 IT 시스템의 장애'라고 설명했다. 이로 인해 모든 항공기 체크인과 운영 시스템에 장애가 발생했다. 이번 사고는 5월 27일 토요일에 일어났다. 항공기 수백 대의 일정이 지연 혹은 취소됐고 승객 수천 명이 주말을 앞두고 런던 히스로 공항에 발이 묶였다. 이번 장애는 이틀이 지난 현재도 완전히 복구되지 않았다.

크루즈는 이번 사고의 원인이 전력 공급 문제라고 밝혔다. 업체 대변인도 "영국 데이터센터의 전력 공급 문제 때문에 발생했다. 비정상적인 파워 서지(power surge) 때문에 데이터센터내 하드웨어가 물리적인 피해를 입었고 그 결과 다른 복잡한 IT 운영 시스템들이 영향을 받았다"고 말했다. 특히 그는 "이런 상황을 대비해 백업 시스템을 갖추고 있지만 이번 사고 복구 과정에서는 제대로 작동하지 않았다"고 말했다.

그동안 전력 문제를 겪은 항공사는 브리티시 에어웨이가 처음이 아니다. 델타 에어라인도 지난 2016년 8월에 비슷한 장애를 겪었다. 업체 본사에 공급되는 전력 전환기에 이상이 발생해 전 세계 비행 업무에 차질을 빚었다. 사안이 조금 다르긴 하지만 지난 달에는 사우스웨스트 에어라인에서 네트워크 라우터 문제로 시스템 장애가 발생하기도 했다.

브리티시 에어웨이는 1개 이상의 데이터센터를 보유하고 있지만 같은 파워 서지가 두 곳 모두에 피해를 줬을 가능성을 배제할 수 없다. 지난 2012년 업체는 히스로 근처의 워터사이드 본사 옆에 데이터센터 2곳을 설립했다고 밝혔다. 이 업체에 DCIM(data center infrastructure management) 시스템을 공급한 업체 선버드(Sunbird)에 따르면, 6개 홀에 데이터 캐비닛 500개를 밀집해 놓은 형태였다.

브리티시 에어웨이는 백업 시스템이 정상 작동하지 않은 이유를 아직 밝혀내지 못했다. IT 팀은 장애가 발생한 이후 현재까지 시스템을 수동으로 복구하고 있으며 이 작업도 아직 완료되지 않았다. 업체 대변인은 "고객의 불편을 해소하는 것을 최우선으로 작업하고 있으며, 이것이 완료되면 정확한 원인을 규명하고 이런 일이 다시 발생하지 않도록 그 원인을 철저하게 조사할 예정이다"고 말했다.

그러나 델타의 경우에도 IT 시스템이 올해 1월 다시 문제를 일으켜 항공기 150대의 운항이 취소됐다. 당시 미국 연방항공국(FAA)은 자동화 관련된 문제가 있었다고 발표하기도 했다. 델타가 그랬던 것처럼 브리티시 에어웨이도 백업 시스템 장애로 티켓 환불과 피해 보상에 막대한 비용이 들 것으로 보인다. 다른 기업도 이와 비슷한 재난이 발생하기 전에 백업과 재해복구, 비즈니스 연속성 계획을 다시 점검하는 것이 필요해 보인다. ciokr@idg.co.kr



2017.05.30

브리티시 에어웨이, 시스템 장애로 항공기 수백 대 운항 차질

Peter Sayer | IDG News Service
영국의 대형 항공사인 브리티시 에어웨이(British Airways)의 데이터센터 장애 사고는 백업 시스템 테스팅과 계획성 있는 재해복구 절차의 중요성을 잘 보여준다.



업체의 CEO 알렉스 크루즈는 이번 사고를 '핵심 IT 시스템의 장애'라고 설명했다. 이로 인해 모든 항공기 체크인과 운영 시스템에 장애가 발생했다. 이번 사고는 5월 27일 토요일에 일어났다. 항공기 수백 대의 일정이 지연 혹은 취소됐고 승객 수천 명이 주말을 앞두고 런던 히스로 공항에 발이 묶였다. 이번 장애는 이틀이 지난 현재도 완전히 복구되지 않았다.

크루즈는 이번 사고의 원인이 전력 공급 문제라고 밝혔다. 업체 대변인도 "영국 데이터센터의 전력 공급 문제 때문에 발생했다. 비정상적인 파워 서지(power surge) 때문에 데이터센터내 하드웨어가 물리적인 피해를 입었고 그 결과 다른 복잡한 IT 운영 시스템들이 영향을 받았다"고 말했다. 특히 그는 "이런 상황을 대비해 백업 시스템을 갖추고 있지만 이번 사고 복구 과정에서는 제대로 작동하지 않았다"고 말했다.

그동안 전력 문제를 겪은 항공사는 브리티시 에어웨이가 처음이 아니다. 델타 에어라인도 지난 2016년 8월에 비슷한 장애를 겪었다. 업체 본사에 공급되는 전력 전환기에 이상이 발생해 전 세계 비행 업무에 차질을 빚었다. 사안이 조금 다르긴 하지만 지난 달에는 사우스웨스트 에어라인에서 네트워크 라우터 문제로 시스템 장애가 발생하기도 했다.

브리티시 에어웨이는 1개 이상의 데이터센터를 보유하고 있지만 같은 파워 서지가 두 곳 모두에 피해를 줬을 가능성을 배제할 수 없다. 지난 2012년 업체는 히스로 근처의 워터사이드 본사 옆에 데이터센터 2곳을 설립했다고 밝혔다. 이 업체에 DCIM(data center infrastructure management) 시스템을 공급한 업체 선버드(Sunbird)에 따르면, 6개 홀에 데이터 캐비닛 500개를 밀집해 놓은 형태였다.

브리티시 에어웨이는 백업 시스템이 정상 작동하지 않은 이유를 아직 밝혀내지 못했다. IT 팀은 장애가 발생한 이후 현재까지 시스템을 수동으로 복구하고 있으며 이 작업도 아직 완료되지 않았다. 업체 대변인은 "고객의 불편을 해소하는 것을 최우선으로 작업하고 있으며, 이것이 완료되면 정확한 원인을 규명하고 이런 일이 다시 발생하지 않도록 그 원인을 철저하게 조사할 예정이다"고 말했다.

그러나 델타의 경우에도 IT 시스템이 올해 1월 다시 문제를 일으켜 항공기 150대의 운항이 취소됐다. 당시 미국 연방항공국(FAA)은 자동화 관련된 문제가 있었다고 발표하기도 했다. 델타가 그랬던 것처럼 브리티시 에어웨이도 백업 시스템 장애로 티켓 환불과 피해 보상에 막대한 비용이 들 것으로 보인다. 다른 기업도 이와 비슷한 재난이 발생하기 전에 백업과 재해복구, 비즈니스 연속성 계획을 다시 점검하는 것이 필요해 보인다. ciokr@idg.co.kr

X