2013.01.25

데이터 삭제, 때로는 최선의 방어 수단

Taylor Armerding | Network World
빅 데이터를 부정적으로 바라보는 기업은 거의 없을 것이다. 맞는 말이다. 적절한 애널리틱스 툴과 함께라면, 빅 데이터는 여러 새로운 가치들을 전해줄 것이다. 그러나 많은 정보 관리(IG, Information Governance) 전문가들은 과도한 데이터가 숨통을 짓누를 수도 있다고 지적하고 있다.

보유한 데이터의 규모가 증가함에 따라 기업들에겐 도난이나 감염으로부터 데이터를 보호하기 위한 방안 역시 더욱 많이 요구되기 마련이다. 이는 경제적으로뿐 아니라 법률적으로도 상당한 부담을 안겨줄 수 있다. 크기만 큰 데이터를 조금은 덜어내보자.

데이터를 비우는 활동은 ‘방어적 처분', ‘방어적 삭제, 또는 ‘적극적 만료' 등 다양한 이름으로 불리고 있다.

eDJ 그룹(eDJ Group)의 공동 설립자이자 수석 애널리스트인 베리 머피는 e디스커버리 저널(eDiscovery Journa)에의 기고문을 통해 “난 개인적으로는 ‘방어적 삭제(defensible deletion)’라는 표현을 선호한다. 하지만 사실 명칭이 뭐가 중요하겠는가? 이러한 활동의 핵심은 불필요한 정보를 선행적으로 제거함으로써 비용 절감과 리스크 감소의 가치를 이끌어내는데 있다”라고 말했다.

머피는 본지에 기고한 포스트를 통해서는 다음과 같이 말했다.

“스토리지 비용은 구축형과 클라우드형 모두에서 감소 추세를 보이고 있다. 그런데 어떤 이들은 이를 근거로 ‘스토리지 비용도 낮아지고 하둡(Hadoop)과 같은 플랫폼을 통해 정보 처리 비용 역시 낮아졌으니 이제는 부담 없이 정보를 영원히 간직할 수 있다’라고 주장한다.”

“그러나 이는 정보의 증가 속도는 고려치 않은 어리석은 생각이다. 정보 규모의 증가 속도가 스토리지 비용 감소폭을 앞지른 것은 이미 예전의 일이다. 또한 기업의 스토리지 속에는 중복된 정보나 불필요한 정보 역시 너무나도 많이 존재한다. 조언하지만 이러한 정보들은 제거하는 것이 보다 경제적인 선택이다.”

인덱스 엔진스(Index Engines)의 마케팅 사업부 부사장 짐 맥건은 지난해 거버먼트 테크놀로지(Government Technology)와의 인터뷰를 통해 “지난 5년 간 많은 기업들이 그간 쌓아온 ‘정보의 호수'를 청소해오고 있다”라고 이야기했다.

그는 기업들을 움직이게 한 동기에 대해 법률적 측면과 경제적 측면으로 해석할 수 있을 것이라고 설명했다.

그는 “15년 전만해도 어떤 부분에서 비용을 절감하거나 책임 소지가 있는 콘텐츠를 숨기는 것은 그리 어렵지 않은 일이었다. 그러나 이제 환경은 변했다. 오늘날의 변호사나 판사들은 웬만한 전문가 수준의 테크놀로지 지식을 갖추고 있다. 더 이상 그들에게 복잡성이나 비용 문제와 관한 변명은 통하지 않을 것이다”라고 지적했다.

머피 역시 이러한 의견에 동의했다. 그는 “전자적 증거 수집의 비용과 리스크는 정보 관리 비용의 경제성 평가에 큰 영향을 미칠 수 있는 요소들이다”라고 말했다.

전자 정보의 관리 원칙은 기존의 종이 문서 관리에 비해 복잡한 측면이 많다. 증거로써 중요한 역할을 할 수 있는 메타데이터(metadata)를 포함하는 경우가 많기 때문이다. 문서의 작성 시기가 저작권 소송에서 수행하는 경우를 예로 들 수 있을 것이다.

그러나 기업이 책임에 대한 걱정으로 전자 문서를 삭제할 수 있다는 의미로 직결되지는 않는다.

머피는 “소송이나 규제와 관련한 정보를 삭제하는 것을 금지하는 합법적 억제 규정이 있다. 이와 관련해 참고할 만한 것으로 연방 민사 소송 규정이 있다. 이는 기업들에게 표준 운영 체제에 따라 제거된 정보와 관련한 책임으로부터의 ‘피난처'를 제공해줄 것이다”라고 말했다.

그는 “‘제거 목록'에 들어가야 할 정보 자산은 중복되어 있거나, 비즈니스 가치가 없는 것들이다. 그러나 아직 많은 기업들이 자신들이 보유한 정보의 가치를 정확히 평가할 역량을 제대로 갖추지 못하고 있는 것이 현실이다. 때문에 그들은 ‘시간 기반 유지 정책'이라는 대안을 적용하고 있다. 예를 들어 많은 기업들은 수신함에 저장된 직원들의 이메일을 90일이 지난 후 무조건 삭제하는 정책을 적용하고 있다. 이들 기업에서는 직원들이 좀 더 오래 보관해야 할 이메일이 있을 경우에는 그것을 중앙 아카이브 폴더로 이동 시켜야 한다”라고 덧붙였다.

그러나 역시 보다 효율적이고 안전하게 정보를 다루기 위해서는 법원에 관련 전자적 저장 정보(ESI, Electronically Stored Information)의 보존을 증명할 수 있는 ‘합법적 유지 관리' 구조를 갖추는 것이 보다 적합할 것이다. 머피는 이를 ‘완벽하진 않지만 합리적인 표준'이라 설명했다.

짐 맥건은 기업들에게 작은 부분에서부터 시작할 것을 조언했다. 그는 “퇴사한 직원의 데이터가 남아있다면, 혹은 어떤 지점에 지난 5년간 아무도 들여다보지 않은 데이터가 박혀있다면, 이들을 보다 경제적인 클라우드 스토리지로 이전하거나 아예 정리해보라”라고 말했다.

하지만 그는 이런 과정에서도 우선 순위 설정은 중요함을 강조했다. 그는 거버먼트 테크놀로지와의 인터뷰에서 “가장 위험한 데이터 환경은 이메일 서버나 레거시 백업 테이프(legacy backup tape) 등이다. 이메일은 소송이나 규제 요청에서 증거 자료로 가장 많이 이용되는 소스이며 레거시 백업 테이프는 이메일이나 파일 등, 말 그대로 모든 것을 저장하는 도구이기 때문이다”라고 설명했다.

이러한 이유로 그는 생성 시기나 최종 접근, 수정 시점, 소유자, 위치, 수/발신자, 주요 키워드 등 데이터와 관련한 정보들을 포함하는 데이터 지도를 작성해볼 것을 조언했다.

그는 “데이터 지도는 파일이나 이메일을 보관할 지 삭제할 지에 관한 기준이 되어줄 것이다. 이는 또한 데이터 삭제와 관련한 문제가 제기되었을 때 그러한 결정을 내린 근거를 설명해줄 수도 있다는 점에서도 중요한 역할을 할 것이다”라고 말했다. ciokr@idg.co.kr



2013.01.25

데이터 삭제, 때로는 최선의 방어 수단

Taylor Armerding | Network World
빅 데이터를 부정적으로 바라보는 기업은 거의 없을 것이다. 맞는 말이다. 적절한 애널리틱스 툴과 함께라면, 빅 데이터는 여러 새로운 가치들을 전해줄 것이다. 그러나 많은 정보 관리(IG, Information Governance) 전문가들은 과도한 데이터가 숨통을 짓누를 수도 있다고 지적하고 있다.

보유한 데이터의 규모가 증가함에 따라 기업들에겐 도난이나 감염으로부터 데이터를 보호하기 위한 방안 역시 더욱 많이 요구되기 마련이다. 이는 경제적으로뿐 아니라 법률적으로도 상당한 부담을 안겨줄 수 있다. 크기만 큰 데이터를 조금은 덜어내보자.

데이터를 비우는 활동은 ‘방어적 처분', ‘방어적 삭제, 또는 ‘적극적 만료' 등 다양한 이름으로 불리고 있다.

eDJ 그룹(eDJ Group)의 공동 설립자이자 수석 애널리스트인 베리 머피는 e디스커버리 저널(eDiscovery Journa)에의 기고문을 통해 “난 개인적으로는 ‘방어적 삭제(defensible deletion)’라는 표현을 선호한다. 하지만 사실 명칭이 뭐가 중요하겠는가? 이러한 활동의 핵심은 불필요한 정보를 선행적으로 제거함으로써 비용 절감과 리스크 감소의 가치를 이끌어내는데 있다”라고 말했다.

머피는 본지에 기고한 포스트를 통해서는 다음과 같이 말했다.

“스토리지 비용은 구축형과 클라우드형 모두에서 감소 추세를 보이고 있다. 그런데 어떤 이들은 이를 근거로 ‘스토리지 비용도 낮아지고 하둡(Hadoop)과 같은 플랫폼을 통해 정보 처리 비용 역시 낮아졌으니 이제는 부담 없이 정보를 영원히 간직할 수 있다’라고 주장한다.”

“그러나 이는 정보의 증가 속도는 고려치 않은 어리석은 생각이다. 정보 규모의 증가 속도가 스토리지 비용 감소폭을 앞지른 것은 이미 예전의 일이다. 또한 기업의 스토리지 속에는 중복된 정보나 불필요한 정보 역시 너무나도 많이 존재한다. 조언하지만 이러한 정보들은 제거하는 것이 보다 경제적인 선택이다.”

인덱스 엔진스(Index Engines)의 마케팅 사업부 부사장 짐 맥건은 지난해 거버먼트 테크놀로지(Government Technology)와의 인터뷰를 통해 “지난 5년 간 많은 기업들이 그간 쌓아온 ‘정보의 호수'를 청소해오고 있다”라고 이야기했다.

그는 기업들을 움직이게 한 동기에 대해 법률적 측면과 경제적 측면으로 해석할 수 있을 것이라고 설명했다.

그는 “15년 전만해도 어떤 부분에서 비용을 절감하거나 책임 소지가 있는 콘텐츠를 숨기는 것은 그리 어렵지 않은 일이었다. 그러나 이제 환경은 변했다. 오늘날의 변호사나 판사들은 웬만한 전문가 수준의 테크놀로지 지식을 갖추고 있다. 더 이상 그들에게 복잡성이나 비용 문제와 관한 변명은 통하지 않을 것이다”라고 지적했다.

머피 역시 이러한 의견에 동의했다. 그는 “전자적 증거 수집의 비용과 리스크는 정보 관리 비용의 경제성 평가에 큰 영향을 미칠 수 있는 요소들이다”라고 말했다.

전자 정보의 관리 원칙은 기존의 종이 문서 관리에 비해 복잡한 측면이 많다. 증거로써 중요한 역할을 할 수 있는 메타데이터(metadata)를 포함하는 경우가 많기 때문이다. 문서의 작성 시기가 저작권 소송에서 수행하는 경우를 예로 들 수 있을 것이다.

그러나 기업이 책임에 대한 걱정으로 전자 문서를 삭제할 수 있다는 의미로 직결되지는 않는다.

머피는 “소송이나 규제와 관련한 정보를 삭제하는 것을 금지하는 합법적 억제 규정이 있다. 이와 관련해 참고할 만한 것으로 연방 민사 소송 규정이 있다. 이는 기업들에게 표준 운영 체제에 따라 제거된 정보와 관련한 책임으로부터의 ‘피난처'를 제공해줄 것이다”라고 말했다.

그는 “‘제거 목록'에 들어가야 할 정보 자산은 중복되어 있거나, 비즈니스 가치가 없는 것들이다. 그러나 아직 많은 기업들이 자신들이 보유한 정보의 가치를 정확히 평가할 역량을 제대로 갖추지 못하고 있는 것이 현실이다. 때문에 그들은 ‘시간 기반 유지 정책'이라는 대안을 적용하고 있다. 예를 들어 많은 기업들은 수신함에 저장된 직원들의 이메일을 90일이 지난 후 무조건 삭제하는 정책을 적용하고 있다. 이들 기업에서는 직원들이 좀 더 오래 보관해야 할 이메일이 있을 경우에는 그것을 중앙 아카이브 폴더로 이동 시켜야 한다”라고 덧붙였다.

그러나 역시 보다 효율적이고 안전하게 정보를 다루기 위해서는 법원에 관련 전자적 저장 정보(ESI, Electronically Stored Information)의 보존을 증명할 수 있는 ‘합법적 유지 관리' 구조를 갖추는 것이 보다 적합할 것이다. 머피는 이를 ‘완벽하진 않지만 합리적인 표준'이라 설명했다.

짐 맥건은 기업들에게 작은 부분에서부터 시작할 것을 조언했다. 그는 “퇴사한 직원의 데이터가 남아있다면, 혹은 어떤 지점에 지난 5년간 아무도 들여다보지 않은 데이터가 박혀있다면, 이들을 보다 경제적인 클라우드 스토리지로 이전하거나 아예 정리해보라”라고 말했다.

하지만 그는 이런 과정에서도 우선 순위 설정은 중요함을 강조했다. 그는 거버먼트 테크놀로지와의 인터뷰에서 “가장 위험한 데이터 환경은 이메일 서버나 레거시 백업 테이프(legacy backup tape) 등이다. 이메일은 소송이나 규제 요청에서 증거 자료로 가장 많이 이용되는 소스이며 레거시 백업 테이프는 이메일이나 파일 등, 말 그대로 모든 것을 저장하는 도구이기 때문이다”라고 설명했다.

이러한 이유로 그는 생성 시기나 최종 접근, 수정 시점, 소유자, 위치, 수/발신자, 주요 키워드 등 데이터와 관련한 정보들을 포함하는 데이터 지도를 작성해볼 것을 조언했다.

그는 “데이터 지도는 파일이나 이메일을 보관할 지 삭제할 지에 관한 기준이 되어줄 것이다. 이는 또한 데이터 삭제와 관련한 문제가 제기되었을 때 그러한 결정을 내린 근거를 설명해줄 수도 있다는 점에서도 중요한 역할을 할 것이다”라고 말했다. ciokr@idg.co.kr

X