지난 13일 저녁 슬랙이 부분적으로 동작하지 않는 사고가 발생했다. 사용자 다수가 다운 디텍터(Down Detector)에 문제를 보고했으며 슬랙이 이상 현상을 공식 확인했다. Some users may experience i...
2022.10.14
지난 13일 저녁 슬랙이 부분적으로 동작하지 않는 사고가 발생했다. 사용자 다수가 다운 디텍터(Down Detector)에 문제를 보고했으며 슬랙이 이상 현상을 공식 확인했다. Some users may experience i...
2022.10.14
지난해 10월 말, 로블록스(Roblox)의 글로벌 온라인 게임 네트워크가 다운됐다. 정지는 3일 동안 지속됐다. 이 사이트는 매일 5,000만 명의 게이머들이 사용하고 있다. 이 혼란의 원인을 파악하여 해결하기 위해 로블록스와 주요 기술 공급자인 하...
2022.02.04
지금은 괜찮아 보일지 모른다. 하지만 경보 신호가 이미 울렸음에도 불구하고 이를 아직 알아채지 못했을 가능성이 있다. 네트워크 상태가 갑자기 나빠지고 간단한 문제 해결에 시간이 더 오래 걸리며 계속 고장 나는 것이 생긴다. 모든 대규모 코드 릴리즈(R...
2018.02.12
2016년에는 매출 타격과 평판 저하로 이어진 굵직굵직한 다운 사고가 수 차례 있었다. 버그 픽스 등에 대응하기 위해 시스템 구성을 변경하려다 발생한 사고들이 잦았다. 빅판다(BigPanda)는 예상하지 못한 다운 사고를 방지하기 위해서는 밟아야 할 ...
2017.01.02
델타 항공과 사우스웨스트 항공이 지난 여름 기록한 IT 시스템 정지 사례는 모든 IT 전문가들이 참고할 만한 교훈을 시사한다. Image Credit : Getty Images Bank 지난 몇 달은 항공 IT 시스템 고장 측면...
2016.09.19
서비스가 멈춰도 좋은 시간이란 없다. 계획된 정지인 경우라도 마찬가지다. 최근에는 글로벌화가 진행되면서 중요하지 않은 시간대도 없어졌다. 사실 상시 동작하고 상시 이용가능한 서비스와 관련해 ‘특효약’이란 없다. 여기 기업의 상시성...
2012.05.04
가상화와 클라우드 컴퓨팅 같은 기술은 효율성과 탄력성을 크게 개선해준다. 그러나 웨스트콘 그룹(Westcon Group)의 빌 헐리 CIO겸 CTO는 반대로 이 기술을 제대로 계획해 이전하지 못한다면, 기업은 이전 기간 동안 이러지도 저러지도 못하는 ...
2012.04.13