Offcanvas

보안 / 빅데이터 | 애널리틱스 / 클라우드

"삭제한 파일도 다시 보자" 클라우드 ‘좀비 데이터’ 경계령

2017.04.25 Fahmida Y. Rashid  |  InfoWorld
인터넷 상에서는 삭제한 파일도 되돌아 봐야 한다. 내가 ‘삭제’ 했다고 생각한 그 파일이 정말로 삭제된 것이 아닐 수도 있다. 우리는 이런 데이터를 ‘좀비 데이터’라 부른다. 클라우드 서비스 업체가 어떤 식으로 파일을 삭제하는지 잘 모르는 기업은 이 때문에 ‘좀비 데이터’에 뒷목을 물리는 경험을 하곤 한다.



PC 혁명 이래로 데이터 삭제의 개념은 많은 오해를 불러왔다. 필요 없어진 파일을 드래그해 휴지통에 버리는 행위는 분명 파일을 더 이상 눈에 보이지 않게 하고, 디스크 공간을 비워 새로운 데이터로 채울 수 있게 해준다. 하지만 새로 데이터를 쓰기 전까지는 원본 데이터가 디스크에 남아있기 때문에 언제든 데이터 복구 툴을 이용해 복구할 수 있다. 심지어 그 자리를 다른 데이터로 채웠어도, 여전히 파일 일부는 남아있기 때문에 그 파편으로부터 원본 파일을 재구성해 낼 수 있다.

아직도 많은 데스크톱 및 모바일 사용자가 파일을 삭제한 것만으로 그것이 영구적으로 사라졌다고 믿지만, 꼭 그런 것은 아니다. 데이터 삭제에 대한 이런 오해는 클라우드 상의 데이터 관리에서 더 큰 문제가 될 수 있다.

클라우드 서비스 업체로서는 사용자가 클라우드 상에서 파일을 지울 경우 그 파일이 모든 서버에서 함께 지워지도록 데이터 보존 지침과 백업 정책, 유저 선호 간에 아슬아슬한 균형을 유지해야 한다. 만일 클라우드 스토리지를 고민하는 기업이라면, 우선 서비스 업체의 데이터 삭제 정책이 자신의 기업에 적합한지를 알아볼 필요가 있다. 자칫하다 데이터 유출이 발생해 파일이 노출되거나, 데이터 처리 규제에 걸려 아주 골치 아픈 일이 생길 수도 있다.

유럽 연합의 데이터 보호 일반 규정(General Data Protection Regulation)이 2018년 5월 발효될 예정인 가운데, 앞으로는 유럽에서, 혹은 EU 회원국 시민을 상대로 비즈니스를 하는 모든 기업은 EU의 클라우드를 비롯한 시스템 상의 개인정보 삭제 규정을 엄수하지 않으면 거액의 벌금을 물게 될 것이다.

클라우드 상의 데이터 삭제, 무엇이 문제인가
클라우드 상의 데이터 삭제는 PC나 스마트폰에서 데이터를 삭제하는 것과 전혀 다르다. 클라우드의 중복성 및 가용성 모델 때문에 모든 파일에는 언제나 여러 개의 사본이 함께 존재한다. 때문에 클라우드 상에서 데이터를 삭제한다는 건 이 모든 파일들을 다 지웠을 때만 가능하다. 사용자는 클라우드 계정에서 파일을 지움으로써 클라우드 상의 모든 파일이 다 사라졌다고 생각하겠지만, 사실은 전혀 그렇지 않다.

다음과 같은 상황을 생각해보자. 클라우드 스토리지 계정을 가진 어느 사용자가 노트북이나 스마트폰, 태블릿에서 파일에 액세스하려 한다. 현재 파일은 사용자의 노트북에 저장되어 있지만 이 문서에 수정을 가할 경우 자동으로 클라우드 상의 사본에 동기화되어 다른 기기들에서도 수정된 파일에 액세스할 수 있다. 클라우드 서비스에 따라서는 수정 전 파일이 저장되는 경우도 있다. 클라우드 서비스 업체의 제일 관심사는 사용자가 언제, 어느 기기에서나 모든 파일에 액세스할 수 있게 하는 것이므로 파일의 복사본을 여러 데이터센터 상의 다수의 서버에 분산시켜 놓는다. 그리고 각 서버는 재난에 대비해 주기적으로 백업된다. 이렇게 하나의 파일에만 여러 개의 복사본이 존재한다.

블랑코 테크놀로지 그룹(Blanco Technology Group)의 최고 전략 임원 리처드 스티에넌은 “클라우드 상에서 파일을 ‘삭제’ 한다 해도 실제 데이터 카피는 여전히 여러 곳에 분산되어 존재하고 있다”고 말했다.

기기에서, 그리고 사용자 계정에서 파일을 지우는 건 그저 전체 데이터 중 눈에 보이는 부분만을 지우는 의미밖에 갖지 못한다. 삭제 버튼을 누르면 파일이 지워졌다는 표시와 함께 사용자의 시야에서는 사라지겠지만, 다른 서버에는 여전히 데이터가 남아 있다. 실제로 사용자가 마음이 변할 경우 삭제했던 파일을 ‘복구’ 할 수도 있고 복구 버튼을 누르면 지워졌던 파일이 다시 계정 목록에 뜨는 것을 볼 수 있다.

클라우드 서비스 업체에 따라서는 30일의 데이터 보존 정책을 취하는 곳도 있다(Gmail은 60일의 보존 기간을 정책으로 한다). 이 경우 사용자가 파일을 삭제해도 이후 30일 동안 데이터가 서버에 남아 있다. 그 기간이 지나면 파일과 사본 모두 서버에서 완전하게 사라진다. 그런가 하면 윈도우의 휴지통처럼 사용자에게 직접 영구 삭제 옵션을 제공하는 곳들도 있다.

문제는 서비스 업체들도 실수를 한다는 것. 지난 2월, 포렌식 업체 엘콤소프트(Elcomsoft)는 사ㅛㅇ자가 삭제한 사파리 브라우저 히스토리 파일 사본이 아이클라우드에 여전히 남아 있는 것을 발견했다. 엘콤소프트 애널리스트에 따르면 아이클라우드가 사용자가 삭제(요청)한 데이터를 서버에서 실제로 삭제하는 대신 사용자에게 보이지 않는 파일 형식으로 전환한 것으로 알려졌다. 또 지난 1월에는 수년 전 지운 줄 알았던 파일들이 계정에 다시 나타나 드롭박스 사용자들을 당황하게 하기도 했다. 버그로 인해 이 파일들이 드롭박스 서버에서 영구적으로 삭제되지 못했고 엔지니어들이 버그를 수정하는 과정에서 실수로 문제의 파일들을 복구해버린 것이었다.

이들 사건은 그 영향력이 적어 단순한 해프닝으로 끝나긴 했다. 드롭박스 사용자들의 경우도 타인의 삭제된 파일까지 보게 되는 일은 없었다. 하지만 이 사례들은 실제로 데이터 삭제 과정에서 실수가 발생할 수 있으며 기관들은 이에 대비해야 함을 보여준다.

그런가 하면 업체가 사용자의 삭제 요청을 성실히 이행하지 않는 경우도 있다. 페이스북이 좋은 예인데, 페이스북은 한 사용자가 무려 2009년에 삭제 요청한 사진을 3년이 지나도록 내리지 않고 공개 상태로 두었다. 또한 삭제를 했다 해도 사진의 사본이 백업 파일이나 클라우드 스냅샷으로 어딘가에 떠돌고 있지 않으리라는 보장도 없다. 아예 소셜 미디어 계정 전체를 삭제했는데도 과거에 소셜 미디어에 올렸던 사진은 여전히 남아 모두에게 공개되고 있는 경험을 한 사용자도 적지 않다.

확실한 것은 데이터 중복성, 데이터 보존 정책 및 데이터 백업이라는 세 마리 토끼를 잡아야 하는 클라우드 서비스 업체의 사정을 아는 이상 데이터가 당연히 완벽히 삭제될 것이라고 마음 놓고 있을 수만은 없다는 것이다.


클라우드 데이터 삭제, 실제로 어떻게 이루어지는가
스티에넌은 몇몇 특정 클라우드 서비스 업체가 데이터를 삭제하는 방식에 대해 임의로 예측할 수는 없다고 말하면서도 많은 업체들이 데이터 백업 및 재해 복구 파일을 오프사이트가 아닌 클라우드 상에 보관하고 있다고 말한다. 때문에 사용자가 계정에서 파일을 삭제해도 사라지는 것은 원본 데이터로 연결되는 포인터(pointer) 파일일 뿐 실제 파일들은 여전히 남아 있다. 대부분의 경우 이것만으로도 충분하기 때문에 문제가 없지만, 아카이브 자체가 해킹 당할 경우 이런 식으로 지워진 콘텐츠는 쉽게 복구할 수 있다.

스티에넌은 “기본적인 삭제 요청은 포인터 파일을 지울 뿐 데이터 자체를 삭제하지는 않으며, 이런 데이터는 쉽게 복구 가능한데다 데이터 유출에 매우 취약하다”고 지적했다.

아예 디스크 상에서 데이터를 지우는 업체도 있다. 이 경우 보통 사용자가 삭제 요청을 할 경우 해당 파일은 별도의 디스크로 옮겨진다. 그리고 비워진 디스크 공간이 다른 파일로 채워지기를 기다린다. 하루에도 수천 건의 트랜잭션이 발생하고 있으므로 당연한 생각이다. 한편 삭제된 파일만을 모아 놓은 디스크가 꽉 차거나 보존 기간이 지나면, 해당 디스크를 재 포맷해 파일이 완전히 지워지도록 한다.

오늘날 대부분 클라우드 서비스 업체는 서버 상의 데이터를 암호화해 놓는다. 그중에는 사용자의 프라이빗 키를 설정해 데이터를 암호화하는 업체들도 있지만, 대부분은 자체적인 키를 모든 사용자의 데이터를 암호화하는 데 일괄적으로 사용한다. 이 경우 업체에서는 암호화 키만 제거할 뿐 실제 파일은 지우지도 않을 가능성도 있다. 이런 방식은 만일 사용자가 하나의 파일만을 삭제하려고 하는 경우 효과적이지 않을 수 있다.

클라우드 상에 존재하는 모든 복사본을 제대로 삭제해야 하는 이유는 또 있다. 몇몇 포렌식 툴을 이용하면 너무나 쉽게 클라우드 서비스를 들여다 보고 삭제된 정보를 복원할 수 있기 때문이다. 엘콤소프트 역시 아이클라우드의 브라우저 히스토리 파일 사건을 그런 식으로 알아냈다. 삭제된 파일의 복사본이 클라우드 어딘가에 존재한다는 걸 알게 된 이상, 이런 질문을 던지지 않을 수 없다. 과연 주인 잃은 이런 파일들이 정부 기관이나 기타 다른 목적을 가진 조직들로부터 얼마나 안전하게 보호될 것인가?

삭제 후에도 남는 파편들
기업들이 디스크 및 디스크 상에 저장된 데이터를 제대로 처리하는 데 어려움을 겪는다는 사실은 연구를 통해 잘 알려져 있다. 블랑코 테크놀로지 그룹의 한 연구 결과에 따르면, 서드파티 판매자로부터 200여 개의 드라이브를 구매한 엔지니어가 이들 드라이브로부터 개인 정보 및 기업 정보를 복원할 수 있음을 알게 됐다. 같은 그룹의 또 다른 설문조사에 따르면 IT팀의 1/3이 SSD를 버리기 전 재포맷 하지만 그 안의 모든 정보가 제대로 제거 되었는지 일일이 확인하지는 않는 것으로 나타났다.

스티에넌은 디스크 상 데이터를 덮어쓰기(overwrite)하지 않는다면, 반드시 데이터가 완전히 파괴되었는지 확인해 봐야 한다. 확인해 보지 않고는 확신해선 안 된다”고 강조했다.

클라우드 상에서 특정 파일을 제거하는 것에 대해서는 우려의 목소리가 있어왔지만, 기업 IT 부서가 클라우드 스토리지 상의 데이터 삭제 요건에 대해 진지하게 생각하기 시작한 것은 얼마 되지 않는다. 아직도 많은 서비스 업체들이 데이터 보존 기간을 수 년씩 설정하고 있다. 짧게는 7년에서 길게는 25년 이상 데이터를 보존하는 경우도 있어 특히 초기 클라우드 도입 기업은 삭제해야 하는 데이터가 생겼을 때 어떻게 하면 이를 완전히 삭제할 수 있을 것인지 고민할 수밖에 없게 되었다.

앞서 언급한 유럽 연합의 데이터 보호 일반규정이 발효되면 기업들은 데이터 소지 목적의 기한이 끝나면 모든 EU 거주자들의 개인 정보를 시스템 상에서 삭제해야만 한다. 때문에 기업들은 사용자 데이터가 제대로 삭제되었는지를 주기적으로, 그리고 꼼꼼하게 확인해야 할 것이다. 만일 규정을 위반 시 기업의 전 세계 연간 수익의 4% 가량을 벌금으로 내게 될 수도 있다.

기업들로써도 클라우드 서비스 업체의 데이터 삭제 방식에 좀 더 신경 쓸 강력한 유인이 생겼다고 할 수 있다.

좀비 데이터 피해, 어떻게 예방할까
이런 문제가 있다는 걸 알았으니, 지금이라도 클라우드 서비스 업체에 연락해 불필요한 데이터가 어떤 식으로 삭제되고 있는지, 클라우드 상의 데이터 삭제가 영구적인지를 확인할 방법은 없는지 물어봐야 한다. 클라우드 업체와 계약을 맺을 때 언제 파일을 제거할 것인지, 데이터 복사본은 어떻게 제거할 것인지 등을 분명히 협의할 필요가 있다. 클라우드 컴플라이언스 감사를 통해 스토리지 업체의 데이터 삭제 정책 및 절차, 그리고 데이터 보호와 처리에 사용된 기술을 검토할 수도 있다.

클라우드와 관련한 보안 이슈가 워낙 여러 가지이다 보니, 파일 삭제와 관련된 문제는 가볍게 여기고 넘어가기 쉽다. 하지만 클라우드에 저장된 데이터를 내가 원하는 때, 원하는 방식으로 제거할 수 없다면 그것은 ‘컴플라이언스’가 아니다. 또 삭제한 줄 알았던 데이터가 해킹이라도 당한다면, 또는 스토리지 업체의 실수로 그 데이터가 노출되기라도 한다면, 결국 그 대가를 치러야 하는 건 고객 기업이다.

스티에넌은 “데이터가 제대로 삭제되지 않는 것은 보안 인식의 왜곡 및 부재 때문이라고 밖에 볼 수 없다. 삭제라는 단어 때문에 데이터가 완전히 사라져 액세스할 수 없게 되었다고 느낄지 모르지만, 사실은 전혀 그렇지 않다”고 경고했다. editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.