Offcanvas

데이터센터 / 통신|네트워크

네트워크 문제로 인한 데이터센터 가동 정지 증가··· 이유는?

2019.03.26 Ann Bednarz  |  Network World


트래버스는 잘못 구성된 라우터와 소프트웨어 정의 네트워크는 “일반적인 네트워크 문제”이며, 사전에 테스트를 통해 걸러내야 한다고 지적했다. 또 트래버스는 광섬유 절단과 관련, 기업은 단일 장애 지점이 있음을 인식하지 못하는 경우가 많다면서 “두 개의 개별 제공업체를 이용하면서 두 업체의 광섬유가 같은 통로를 지난다는 사실을 알지 못하는 경우가 있다. 이를 확인하기 위한 정밀 실사를 하지 않았기 때문”이라고 말했다.

IT와 관련된 가동 중단에서 지목된 원인은 다음과 같다.

- 제대로 관리하지 않은 업그레이드. 소프트웨어 수준에서 충분한 테스트를 하지 않음
- 대용량 디스크 드라이브 또는 스토리지 영역 네트워크의 장애와 이로 인한 데이터 손상. 이 문제는 일반적으로 하드웨어 고장으로 인해 발생하며 구성 또는 프로그래밍 오류로 인해 악화됨.
- 로드밸런싱 분산 또는 트래픽 관리 시스템 전반의 동기화 장애 또는 프로그래밍 오류
- 잘못 프로그램된 장애/동기화 또는 재해 복구 시스템
- 백업되지 않는 단일 구성요소(서버 또는 대용량 디스크 드라이브 등)에 대한 전원 공급 손실

로드밸런싱/트래픽 관리 문제와 관련, 로렌스는 기업이 IT 리소스를 더 폭넓게 분산하는 과정에서 프로그래밍 오류와 동기화 문제가 발생할 수 있다면서 “단일 사이트에 대한 종속성을 낮추기 위한 더 큰 전략을 추진하는 과정에서 발생하는 경우가 많다. 풍선효과와 같다. 어느 한 지점을 누르면 다른 곳에서 문제가 튀어나온다”고 설명했다. 

트래버는 “기업이 애플리케이션 및 데이터가 운영되는 모든 플랫폼을 대상으로 충분히 계획하지 않거나 정기적으로 테스트하지 않은 경우 문제가 발생한다”고 지적했다.

전원 문제로 인한 중단에서 주요 원인은 다음과 같다.

- 낙뢰로 인한 서지와 정전. 백업 소프트웨어/구성 실패
- 전환 스위치의 간헐적인 장애로 인해 발전기 시동 또는 예비 데이터센터로의 전환 실패
- UPS 장애 및 예비 시스템으로의 전환 실패
- 운영자의 실수로 전원을 끄거나 잘못 구성
- 발전 설비 전원 손실로 인한 발전기 또는 UPS 장애
- 전원 서지로 인한 IT 장비 손상
- IT 장비에 보조 전원으로 전환하기 위한 이중 전원 공급 장치가 장착되지 않음

브라운은 전원 관련 원인 중에서 생소하거나 뜻밖이라고 할 만한 것은 없다면서 “데이터센터 엔지니어들이 수십년 동안 설계를 통해 피하고 완화하기 위해 씨름해온 원인”이라고 말했다.

트래버는 기업이 데이터센터 복원성에 더 많은 관심을 가져야 한다면서 “시스템이 어떻게 설계되었는지 알아야 한다. 모든 상호의존성을 포함해서 완전히 파악해야 하며 어떻게 장애가 발생하는지도 이해하고 장애에 대비해 계획해야 한다. 현재 부족한 부분이 바로 이것”이라고 말했다.

로렌스는 “장비는 계속 좋아지고 관리도 계속 좋아지고 경험의 질도 계속 좋아지고 있다. 더 성숙한 업계로 발전 중”이라면서 “그러나 가동 정지는 여전히 중대하고 큰 피해를 유발하는 문제”라고 강조했다.  editor@itworld.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.