Offcanvas

CIO / CSO / 검색|인터넷 / 보안 / 통신|네트워크

911 전화까지 불통··· 캐나다 로저스 인터넷 중단 사고의 교훈

2022.09.01 James Careless  |  CIO
2022년 7월 8일, 캐나다의 로저스 ISP(Rogers ISP) 네트워크를 어설프게 유지보수 업데이트하는 실수로 인해 캐나다 전역에 최소 12시간 동안 인터넷 액세스 문제가 발생했다. 일부 고객들은 이후 며칠 동안 문제를 겪기도 했다.

약 1,220만 사용자의 스마트폰 및 전화서비스에 영향을 미쳤으며 인터렉(Interac) 네트워크에서 POS(Point Of Sale) 직불 결제가 중단되면서 로저스 스마트폰 사용자들이 9-1-1 서비스에 액세스하지 못했다. 또 온라인 결제 전송 서비스가 중단됐으며, 토론토에서의 교통 신호가 송두리째 오작동했다. 

이 고장 정지로 인해 토론토의 로저스 센터(Rogers Centre)에서 개시된 캐나다의 음악 그룹 더 위켄드(The Weekend)는 월드투어를 연기해야 하기도 했다.

원인은? 이후 로저스가 규제당국 CRTC(Canadian Radio-television and Telecommunications Commission)에 제출한 내용에는 다음과 같이 기술돼 있다. “업데이트로 인해 라우팅 필터가 삭제되고 인터넷으로 연결된 모든 라우터가 라우터를 통과하게 되었다... 특정 네트워크 라우팅 장비가 영향을 받았고 용량 레벨을 초과했으며 이후에 트래핑을 라우팅할 수 없어 일반 코어 네트워크가 트래픽 처리를 멈추게 되었다.”

캐나다의 주요 인터넷, 방송, 모바일 무선 기업 중 하나인 로저스가 하루 안에 대부분의 고객들의 서비스를 복구했지만 이 파멸적인 서비스 상실로 캐나다의 기업들이 깜짝 놀랐다. 

농장 및 농업 공급 소매기업 피비 마트(Peavey Mart)도 그 중 하나다. 이 기업이 운영하는 약 100개의 아웃렛 등 일부는 이미 다른 인터넷 제공업체에 대한 여분의 액세스를 확보했었다. 그 결과, “2개의 매장만 직접적인 영향을 받아 인터넷 연결을 하지 못했다. 하지만 우리는 고객들이 거래할 수 있도록 인터랙 서비스에만 의존하고 있고, 이는 로저스만 처리하고 있는 부분이기 때문에 직불 카드 결제를 처리할 수 없었다”라고 해당 기업의 정보 기술 수석 VP 겸 CIO AoC(Association of Canada)의 VP 숀 구스리가 말했다.
 
Image Credit : Getty Images Bank

캐나다 국외에도 영향
캐다나의 여러 비영리 조직을 대상으로 CIO 겸 전략 기술 컨설턴트 역할을 서비스하는 헬렌 나이트는 “내가 서비스를 제공하는 일부 비영리 조직은 1~2일 동안 취약계층의 요구에 대응하지 못했다. 개인적으로 자녀들과 나는 의사소통 수단이 없어졌고, 나의 13살 딸이 밤 10시까지 돌아오지 않고 있을 때, 그녀가 집으로 돌아올 수 있는 수단이 없을까봐 걱정했다”라고 말했다.

다른 이들도 그리 행운이 따르지 않았다. WWWI(WhiteWater West Industries)의 IT 운영 및 업무지원센터 관리자 크리스 팔슨바그는 “워터슬라이드와 워터파크 명소를 운영하는 글로벌 기업으로써 로저스 네트워크 고장 정지는 우리가 생각했던 것보다 더 많은 영향을 미쳤다. 해외 여행 중인 직원들은 심지어 스마트폰도 사용할 수 없었다”라고 말했다.

SLG(Sapper Labs Group)는 캐나다의 사이버 보안/사이버 인텔리전스 기업이다. SL의 CIO 데이브 맥마혼은 “우리의 기업의 경우 로저스 고장 정지에 영향을 받지 않았지만 많은 파트너, 고객, 경쟁사들이 영향을 받았다. 일부 조직들은 아직 완전히 회복하지 못했으며, 시장 전번에 걸쳐 파급효과를 낳고 있다”라고 말했다.

로저스 고장 정지 이후 캐나다의 CIO 및 IT 임원과 전문가들은 앞으로 이런 장애에 대응할 수 있는 스스로의 준비 상황을 검토하고 있다. 그들이 배운 교훈은 서비스 고장 정지에 직면할 위험이 있는 모든 CIO들이 알아둘 만하다.

가외성(redundancy)을 구축하라
로저스 고장 정지는 추가 ISP 확보의 가치를 잘 보여주었다. 일부 기업들은 추가 비용에 망설이고 있지만 피비 마트는 여분의 인터넷 액세스에 대한 비용 지불의 가치를 인정한다. 해당 기업은 2022년 7월 8일 이런 선견지명에 대한 보상을 받았다.

로저스 ISP 네트워크의 장애에서도 해당 기업은 피해를 입지 않았다. 왜냐하면 구스리는 “우리는 데이터 통신의 상태를 선제적으로 모니터링하기 때문이다. 그 결과, 매장들이 고장 정지에 영향을 받았을 때 SD-WAN 지원 인프라를 통해 보조 ISP로 자동 시스템 대체 작동을 실시했다”라고 말했다.

캐나다의 구세군 등 비영리 조직들은 피비 마트처럼 추가 인프라를 도입할 수 없다. 하지만 이러한 조직의 CIO들은 “무료 소프트웨어와 기부된 하드웨어를 사용하여 놀라운 결과를 달성하는 데” 익숙한 단호한 전문가들이라고 나이트가 말했다. 그녀는 “그들은 노후화된 IT 인프라의 장애에 익숙해져 있기 때문에 일반적으로 복구를 위한 수동 프로세스가 있다”라고 말했다.

그 결과, 캐나다의 비영리 CIO들은 최소한 ISP 장애가 실제로 발생하는 시점에 대응할 수 있다. 나이트는 “단 고장 정지로 인해 손실된 데이터는 이후에 영향을 미칠 수밖에 없다, 기부자들에게 보여줄 올바른 기록이 없다면 잠재적으로 미래의 기부금에 영향이 미칠 것이다”라고 말했다. 

그래서 나이트는 이번 로저스 고장 정지가 여분의 ISP 액세스에 대한 조직의 태도를 바꿀 수 있다고 생각한다. 그녀는 “이제 비영리 조직들도 새로운 위험 영역을 이해하게 되었다는 점은 오히려 다행이다. 어쩌면 이 교훈을 얻는 가장 저렴하고 쉬운 방법이 될 수도 있다. 사이버 유출에 직면하는 것보다 훨씬 낫다”라고 말했다.

파트너의 백업 계획을 확인하라
맥마혼은 “로저스 고장 정지로 우리의 아키텍처와 운영 방식에 대한 신뢰가 높아졌다”라고 말했다. 하지만 이런 자신감으로 한 기업의 IT 인프라가 별개로 존재하지 않는다는 점이 좀 더 명확해졌다. 기업의 IT 인프라는 ISP, 클라우드 플랫폼, 인터넷을 통해 기업에 연결하는 이들로 구성된 체인의 일부분일 따름이다.

그는 “즉 로저스 고장 정지가 전하는 교훈이 있다. 공급망, 파트너, 고객이 동등하게 준비하고 비즈니스 운영 유지에 도움이 되는 대비계획을 수립해야 한다는 것이다. 고장 정지로 인해 누가 로저스의 고객인지, 대체 통신 수단이 있는지 여부, 사이버 보안 성숙도, 생태계 전반에 걸친 중요한 독립성 등이 즉시 드러났다”라고 말했다.

피비 마트는 데이터 공급망의 취약성에 대해서도 부지런히 확인하고 있다. 구스리는 “우리는 모든 클라우드 제공업체들에게 가외성이 있는지 질문한다. 시스템에 백업 시스템으로의 시스템 대체 작동이 있는가? 그리고 장애 발생 시 사람들이 어떤 일을 해야 하는지 알 수 있도록 비즈니스 연속성 계획 등이 있는가? 그리고 우리는 이것들을 미리 질문한다”라고 말했다.

안타깝게도, 피비 마트 같은 소매기업들은 인터랙 등 캐나다의 은행간 대기업에게 이런 답변을 요구할 수 있는 영향력이 없다. 그는 “그 결과, 우리는 어쩔 수 없이 인터랙이 이런 백업 조치가 있다고 가정했지만 실제로는 그렇지 않았다”라고 말했다.

추가적인 ISP 장애 가능성을 상정하라
캐나다에서 로저스 고장 정지 해결 이후 정부의 조사, 부정적인 언론 보도, 많은 예측 가능한 일반 정지 사고가 이어졌다. 하지만 그 어떤 반응도 매우 단순한 사실을 바꾸지 못할 것이다. ISP 네트워크는 시뮬레이션으로 완전하게 모델링할 수 없는 많은 부분들로 구성된 복잡하고 광범위한 시스템이라는 사실이다.

로저스는 “분명 추가적인 장애가 발생할 것이라 확신한다”라고 전망했다. 구스리 또한 “누가 될지는 모르겠지만 1년 안에 추가적인 장애가 발생할 가능성이 높다”라고 진단했다.

이는 ISP 액세스에 의존하고 있는 CIO들은 이제 이런 고장 정지로부터 기업을 보호하기 위해 조치를 취해야 한다는 의미로 이어진다. 데이브 맥마혼에 따르면 “앞으로의 길은 명확하다. 이중 제공업체 및 여분의 독립적 시스템이 모범 관행이다”라고 말했다.

그는 이어 “이것이 고가용성 시스템의 정의이다. SL의 모든 직원들은 이미 다양한 보안 통신 수단과 온라인 협업 역량을 확보하고 있다. 우리는 현재 유사하게 안전한 높은 신뢰도의 솔루션을 고객 및 파트너에게 확대할 수 있는 최선의 방안을 평가하고 있다”라고 덧붙였다.

이와 동시에 CIO는 이런 이벤트에 대비할 수 있는 자신의 능력을 과대평가해서는 안 된다는 지적도 나왔다.

나이트는 “모든 위험으로부터 보호하는 것은 불가능하거나 비용 효율적이지 않다. 대신에 중요한 운영 영역에 대해 각 위험의 영향과 긴급성을 정량화하고 조직 연속성 계획의 우선순위를 설정하는 것이 중요하다”라고 말했다.

로저스 스타일의 ISP 고장 정지는 앞으로 전 세계 기업들의 CIO들에게 닥칠 수 있으며 그럴 가능성이 높은 위기이다. 그래서 이제는 반드시 여분의 시스템을 강화하고 비상 계획을 준비하여 기업에 대한 이런 통신 장애의 필수불가결한 영향을 최소화하고 완화해야 한다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.