2014.09.26

기고 |"방치하면 독, 잘 쓰면 약" 다크 데이터 다루기

Ed Tittel | CIO

데이터베이스 안에 있는 콘텐츠 같은 정형 데이터는 상대적으로 관리하기 쉽다. 하지만 로그 아카이브와 태깅 정보 없는 정리되지 않은 다른 데이터 같은 비정형 데이터들이 문제다. 이들은 민감한 기업 정보인 경우가 많으며 CIO들에게 골치거리다. 기업 내 쌓이기만 하고 실제로 거의 사용하지 않는 다크 데이터가 왜 보안 위험이 될 수 있고 어떻게 보호할 수 있는지 알아보자.



‘다크 파이버(Dark Fiber)’는 통신 산업을 뜻하는 말인데 많은 기업이나 조직에서 ‘다크 데이터(Dark Data)’가 같은 의미로 쓰인다. 다크 데이터처럼 가공되지도 보호받지도 않는 다량의 데이터는 스토리지 공간만 차지할 뿐 결과적으로 아무런 효과가 없다.

아이작 사콜릭은 다크 데이터를 “기업 차원에서 ‘만일을 대비하여' 저장하지만 (현재까지) 적절한 용도를 발견하지 못한 데이터”라고 설명했다.

다크 파이버는 아무것도 하지 않은 채 기다리면서 대역폭과 저장용량만 잡아먹고 있지만, 가공하지 않고 방치된 다크 데이터는 잘못 사용하거나 소유자의 통제를 벗어났을 때 보안 위험마저 야기할 수 있다.

다크 데이터는 예측할 수 없고, 예기치 못한 위협을 가한다
다크 데이터에 관한 대부분의 논의는 조직 내 잠재적인 가치와 활용도에 초점을 맞추는 경향이 있다. 실제로 자원(돈, 도구, 시간)을 들여 다크 데이터에 갇혀 있는 정보와 가치를 개발 및 활용하려는 조직들에게 이런 잠재력은 확실히 매력적이다. 또한 이 때문에 많은 조직들이 단기적 또는 장기적인 계획에 있어서 실제로 활용할 계획이 없는데도 다크 데이터를 포기하고 싶어하지 않는다.

잠재적인 수익과 흥미가 있는 많은 정보 자산과 마찬가지로 조직들은 스스로 소유하고 있는 다크 데이터, 또는 좀 더 냉정하게 말해서 즉각적인 통제와 관리를 벗어난 클라우드에 저장돼 있는 그 자신, 고객, 활동에 관한 다크 데이터가 지속적인 비즈니스 건전성과 웰빙에 위험이 될 수 있음을 인지해야 한다.

이런 위험은 조사관이 자신에게 제공된 일련의 다크 데이터로부터 파악할 수도 있는 데이터의 종류와 품질에 달려 있다. 대부분의 조직들이 수집하는 데이터의 종류에 있어서 이런 위험에는 다음 중 일부 또는 전부가 포함될 수도 있다.

법률 및 규제 위험. 기밀, 재무 정보(신용카드 기타 계좌 데이터), 환자 기록 등 의무 또는 규정에 따르는 데이터가 다크 데이터 중에 있을 경우, 이 데이터가 유출됐을 때는 법률 및 재정적 책임이 따를 수 있다.

정보 위험. 다크 데이터에 비즈니스 활동, 경쟁우위, 중요 협력관계, JV(Joint Venture) 등 상표권이 등록되거나 민감한 데이터가 포함되어 있는 경우, 우연한 노출이 결과에 부정적인 영향을 끼치거나 중요한 비즈니스 활동과 관계를 망쳐버릴 수도 있다.

평판 위험. 모든 종류의 데이터 해킹은 피해를 입은 기관에 악영향을 끼친다. 다크 데이터도 다른 종류의 해킹들과 마찬가지로 (특히 다른 위험의 측면에서) 예외는 아니다.

기회 비용. 조직이 다크 데이터의 분석과 마이닝에 투자하지 않기로 결정한 상황에서 그 가치를 활용하려는 제 3자의 결연한 노력은 지식과 그 콘텐츠에 기반한 가치의 잠재적인 손실을 의미할 수 있다.

제한 없는 노출. 다크 데이터는 마이닝을 위해 추출하기 어렵거나 비용이 높거나 알려지지 않은 (그래서 평가되지 않은) 정보의 출처와 손실, 또는 피해 기업의 정보를 포함한다. 다크 데이터의 매우 비밀스럽고 실제로 손해를 끼칠 수 있지만 확실히 알 수 있는 방법은 없다. 이런 위험을 전적으로 심각하게 고려하는 사람들에게는 만족감이나 무관심 중 그 어느 것도 불러 일으킬 수 없다.




2014.09.26

기고 |"방치하면 독, 잘 쓰면 약" 다크 데이터 다루기

Ed Tittel | CIO

데이터베이스 안에 있는 콘텐츠 같은 정형 데이터는 상대적으로 관리하기 쉽다. 하지만 로그 아카이브와 태깅 정보 없는 정리되지 않은 다른 데이터 같은 비정형 데이터들이 문제다. 이들은 민감한 기업 정보인 경우가 많으며 CIO들에게 골치거리다. 기업 내 쌓이기만 하고 실제로 거의 사용하지 않는 다크 데이터가 왜 보안 위험이 될 수 있고 어떻게 보호할 수 있는지 알아보자.



‘다크 파이버(Dark Fiber)’는 통신 산업을 뜻하는 말인데 많은 기업이나 조직에서 ‘다크 데이터(Dark Data)’가 같은 의미로 쓰인다. 다크 데이터처럼 가공되지도 보호받지도 않는 다량의 데이터는 스토리지 공간만 차지할 뿐 결과적으로 아무런 효과가 없다.

아이작 사콜릭은 다크 데이터를 “기업 차원에서 ‘만일을 대비하여' 저장하지만 (현재까지) 적절한 용도를 발견하지 못한 데이터”라고 설명했다.

다크 파이버는 아무것도 하지 않은 채 기다리면서 대역폭과 저장용량만 잡아먹고 있지만, 가공하지 않고 방치된 다크 데이터는 잘못 사용하거나 소유자의 통제를 벗어났을 때 보안 위험마저 야기할 수 있다.

다크 데이터는 예측할 수 없고, 예기치 못한 위협을 가한다
다크 데이터에 관한 대부분의 논의는 조직 내 잠재적인 가치와 활용도에 초점을 맞추는 경향이 있다. 실제로 자원(돈, 도구, 시간)을 들여 다크 데이터에 갇혀 있는 정보와 가치를 개발 및 활용하려는 조직들에게 이런 잠재력은 확실히 매력적이다. 또한 이 때문에 많은 조직들이 단기적 또는 장기적인 계획에 있어서 실제로 활용할 계획이 없는데도 다크 데이터를 포기하고 싶어하지 않는다.

잠재적인 수익과 흥미가 있는 많은 정보 자산과 마찬가지로 조직들은 스스로 소유하고 있는 다크 데이터, 또는 좀 더 냉정하게 말해서 즉각적인 통제와 관리를 벗어난 클라우드에 저장돼 있는 그 자신, 고객, 활동에 관한 다크 데이터가 지속적인 비즈니스 건전성과 웰빙에 위험이 될 수 있음을 인지해야 한다.

이런 위험은 조사관이 자신에게 제공된 일련의 다크 데이터로부터 파악할 수도 있는 데이터의 종류와 품질에 달려 있다. 대부분의 조직들이 수집하는 데이터의 종류에 있어서 이런 위험에는 다음 중 일부 또는 전부가 포함될 수도 있다.

법률 및 규제 위험. 기밀, 재무 정보(신용카드 기타 계좌 데이터), 환자 기록 등 의무 또는 규정에 따르는 데이터가 다크 데이터 중에 있을 경우, 이 데이터가 유출됐을 때는 법률 및 재정적 책임이 따를 수 있다.

정보 위험. 다크 데이터에 비즈니스 활동, 경쟁우위, 중요 협력관계, JV(Joint Venture) 등 상표권이 등록되거나 민감한 데이터가 포함되어 있는 경우, 우연한 노출이 결과에 부정적인 영향을 끼치거나 중요한 비즈니스 활동과 관계를 망쳐버릴 수도 있다.

평판 위험. 모든 종류의 데이터 해킹은 피해를 입은 기관에 악영향을 끼친다. 다크 데이터도 다른 종류의 해킹들과 마찬가지로 (특히 다른 위험의 측면에서) 예외는 아니다.

기회 비용. 조직이 다크 데이터의 분석과 마이닝에 투자하지 않기로 결정한 상황에서 그 가치를 활용하려는 제 3자의 결연한 노력은 지식과 그 콘텐츠에 기반한 가치의 잠재적인 손실을 의미할 수 있다.

제한 없는 노출. 다크 데이터는 마이닝을 위해 추출하기 어렵거나 비용이 높거나 알려지지 않은 (그래서 평가되지 않은) 정보의 출처와 손실, 또는 피해 기업의 정보를 포함한다. 다크 데이터의 매우 비밀스럽고 실제로 손해를 끼칠 수 있지만 확실히 알 수 있는 방법은 없다. 이런 위험을 전적으로 심각하게 고려하는 사람들에게는 만족감이나 무관심 중 그 어느 것도 불러 일으킬 수 없다.


X