2012.01.20

글로벌 칼럼 | 데이터 거품을 제거하는 네 가지 방법

Rick Clark | Network World
2012년에는 데이터센터를 체중 감량 캠프로 보내 더 건강하고 날씬한 데이터센터를 만들어 보자. 
 
비정형 데이터(이메일, 스프레드시트, 문서 및 디지털 미디어 등)가 조직 데이터에서 차지하는 비중은 최소 90%로 추정된다. 개인적인 아이튠즈 재생 목록부터 이미 오래 전에 발표한 파워포인트 프레젠테이션 파일에 이르기까지 온갖 파일들이 시스템에 꽉 들어차 있다. 게다가 가트너와 IDC의 애널리스트들은 IT 조직의 데이터가 향후 5년 동안 최대 800%까지 증가할 것으로 예측한다.
 
기업은 파일별 인벤토리 기능을 제공해 중복되는 파일, 사용되지 않는 파일, 사용 빈도가 떨어지거나 정책을 위반하는 파일을 찾아주는 도구를 사용해서 정보 팽창과 맞서 싸울 수 있다. 즉, 불필요한 테라바이트급 데이터들을 없애는 것이 가능하다. 다음은 이를 위한 몇 가지 팁이다.
 
팁 1 : 기술 인벤토리화
대부분의 기업은 자사의 문제가 얼마나 큰지 잘 모른다. 어떤 콘텐츠를 보유하고 있는지, 누가 그 콘텐츠를 만들었는지, 이런 콘텐츠가 어떤 리소스를 소비하며 얼마나 많은 데이터가 중복되는지 알지 못한다. 
 
우리와 작업하는 기업들을 보면 일반적으로 NAS 데이터의 50~60%는 몇년 동안 전혀 이용되지 않은 데이터다.
 
많은 사람들은 필요한 데이터와 불필요한 데이터를 구분해 분류하는 일이 너무 어렵다고 생각하기 때문에 문제는 더욱 커진다. 일반적인 수동 프로파일링은 어렵고 비용도 많이 든다. 따라서 프로파일링은 드물게 실행되고(1년에 한 번하는 경우도 있음), 이로 인해 데이터가 기업 및 스토리지 리소스에 미치는 영향을 파악하기가 불가능해진다.
 
불필요한 파일을 파악하고 스토리지를 재계층화하고 스토리지 사용 패턴의 추세를 파악하려면, 먼저 현재의 역량을 인식하고 알맞은 도구를 선택해야 한다. 비정형 환경 전체 또는 일부에 대한 다양한 수준의 가시성을 제공하는 여러 가지 도구들이 있다.
 
네이티브 어레이 모니터링 도구들은 어레이 용량 수준에서 그치는 경우가 많다. 예를 들어 파일이 마지막으로 액세스된 시점과 같은 파일 수준의 정보를 제공하지 못한다. 게다가 사용 용량을 과도하게 추정하는 경향이 있기 때문에, 실제로 필요한 시점보다 더 빨리 추가 어레이를 구입하도록 유도한다. 파일 트리를 탐색하는 솔루션들은 대부분 다루기가 어렵고 시스템에 상당한 부담을 가하기 때문에 보고 기능뿐만 아니라 네트워크 전체의 성능을 저하시킨다. 
 
이처럼 거추장스러운 도구들은 배포하는 데 몇 개월 또는 몇 년이 걸리기도 하고, 관계형 모니터링 데이터베이스를 피드하기 위한 에이전트 설치를 강요하기도 한다. 이러한 에이전트 역시 시스템 속도를 저하시키고 확장 관련 문제를 일으킬 수 있다.
 
가벼운 솔루션들은 몇 주만에 배포가 가능하고 에이전트 없이도 작동한다. 일부는 전용 데이터베이스를 사용해 파일 메타데이터를 수집한다(전체 파일을 수집하지 않음). 이로써 표준 관계형 데이터베이스보다 10~100배 더 빠르게 수십억 개의 파일을 특성화하고 보고할 수 있다. 이런 솔루션의 다수는 데이터 무버(mover) 또는 사용자 스크립트와 짝을 이뤄 데이터의 제거, 보관, 재계층화를 구현할 수 있다.
 
팁 2 : 부적절한 파일 찾기
조직에서 최종 사용자 파일은 비정형 데이터의 상당 부분을 차지하며, 많은 경우 여러 개의 중복 버전이 여러 위치에 저장되어 있다. 거의 모든 기업에는 직원 개인 파일과 사진, 비디오, 재생 목록, 잠재적 바이러스부터 지난 버전의 문서에 이르는 파일들이 이런저런 형태로 저장되어 있다. 이런 파일들은 리소스를 갉아먹는다. 파일에 우선 순위를 부여해 파일을 제거하거나 재계층화하고 저장 공간을 회수해야 한다.
 
해고 또는 퇴직한 직원이 소유한 데이터 역시 보안 측면에서 문제가 될 수 있다. 이런 파일은 신속하게 찾아서 격리하거나 보관해 데이터 소유 및 보존에 대한 기업 가이드라인이 유지되도록 해야 한다. 데이터센터에 다이어트가 필요하다면 관리자들이 파일 형식별로 파일 정보를 집계, 분석해 회사의 보존 및 무단 사용 정책을 더욱 효율적으로 적용하는 감시자 역할을 해야 한다.
 



2012.01.20

글로벌 칼럼 | 데이터 거품을 제거하는 네 가지 방법

Rick Clark | Network World
2012년에는 데이터센터를 체중 감량 캠프로 보내 더 건강하고 날씬한 데이터센터를 만들어 보자. 
 
비정형 데이터(이메일, 스프레드시트, 문서 및 디지털 미디어 등)가 조직 데이터에서 차지하는 비중은 최소 90%로 추정된다. 개인적인 아이튠즈 재생 목록부터 이미 오래 전에 발표한 파워포인트 프레젠테이션 파일에 이르기까지 온갖 파일들이 시스템에 꽉 들어차 있다. 게다가 가트너와 IDC의 애널리스트들은 IT 조직의 데이터가 향후 5년 동안 최대 800%까지 증가할 것으로 예측한다.
 
기업은 파일별 인벤토리 기능을 제공해 중복되는 파일, 사용되지 않는 파일, 사용 빈도가 떨어지거나 정책을 위반하는 파일을 찾아주는 도구를 사용해서 정보 팽창과 맞서 싸울 수 있다. 즉, 불필요한 테라바이트급 데이터들을 없애는 것이 가능하다. 다음은 이를 위한 몇 가지 팁이다.
 
팁 1 : 기술 인벤토리화
대부분의 기업은 자사의 문제가 얼마나 큰지 잘 모른다. 어떤 콘텐츠를 보유하고 있는지, 누가 그 콘텐츠를 만들었는지, 이런 콘텐츠가 어떤 리소스를 소비하며 얼마나 많은 데이터가 중복되는지 알지 못한다. 
 
우리와 작업하는 기업들을 보면 일반적으로 NAS 데이터의 50~60%는 몇년 동안 전혀 이용되지 않은 데이터다.
 
많은 사람들은 필요한 데이터와 불필요한 데이터를 구분해 분류하는 일이 너무 어렵다고 생각하기 때문에 문제는 더욱 커진다. 일반적인 수동 프로파일링은 어렵고 비용도 많이 든다. 따라서 프로파일링은 드물게 실행되고(1년에 한 번하는 경우도 있음), 이로 인해 데이터가 기업 및 스토리지 리소스에 미치는 영향을 파악하기가 불가능해진다.
 
불필요한 파일을 파악하고 스토리지를 재계층화하고 스토리지 사용 패턴의 추세를 파악하려면, 먼저 현재의 역량을 인식하고 알맞은 도구를 선택해야 한다. 비정형 환경 전체 또는 일부에 대한 다양한 수준의 가시성을 제공하는 여러 가지 도구들이 있다.
 
네이티브 어레이 모니터링 도구들은 어레이 용량 수준에서 그치는 경우가 많다. 예를 들어 파일이 마지막으로 액세스된 시점과 같은 파일 수준의 정보를 제공하지 못한다. 게다가 사용 용량을 과도하게 추정하는 경향이 있기 때문에, 실제로 필요한 시점보다 더 빨리 추가 어레이를 구입하도록 유도한다. 파일 트리를 탐색하는 솔루션들은 대부분 다루기가 어렵고 시스템에 상당한 부담을 가하기 때문에 보고 기능뿐만 아니라 네트워크 전체의 성능을 저하시킨다. 
 
이처럼 거추장스러운 도구들은 배포하는 데 몇 개월 또는 몇 년이 걸리기도 하고, 관계형 모니터링 데이터베이스를 피드하기 위한 에이전트 설치를 강요하기도 한다. 이러한 에이전트 역시 시스템 속도를 저하시키고 확장 관련 문제를 일으킬 수 있다.
 
가벼운 솔루션들은 몇 주만에 배포가 가능하고 에이전트 없이도 작동한다. 일부는 전용 데이터베이스를 사용해 파일 메타데이터를 수집한다(전체 파일을 수집하지 않음). 이로써 표준 관계형 데이터베이스보다 10~100배 더 빠르게 수십억 개의 파일을 특성화하고 보고할 수 있다. 이런 솔루션의 다수는 데이터 무버(mover) 또는 사용자 스크립트와 짝을 이뤄 데이터의 제거, 보관, 재계층화를 구현할 수 있다.
 
팁 2 : 부적절한 파일 찾기
조직에서 최종 사용자 파일은 비정형 데이터의 상당 부분을 차지하며, 많은 경우 여러 개의 중복 버전이 여러 위치에 저장되어 있다. 거의 모든 기업에는 직원 개인 파일과 사진, 비디오, 재생 목록, 잠재적 바이러스부터 지난 버전의 문서에 이르는 파일들이 이런저런 형태로 저장되어 있다. 이런 파일들은 리소스를 갉아먹는다. 파일에 우선 순위를 부여해 파일을 제거하거나 재계층화하고 저장 공간을 회수해야 한다.
 
해고 또는 퇴직한 직원이 소유한 데이터 역시 보안 측면에서 문제가 될 수 있다. 이런 파일은 신속하게 찾아서 격리하거나 보관해 데이터 소유 및 보존에 대한 기업 가이드라인이 유지되도록 해야 한다. 데이터센터에 다이어트가 필요하다면 관리자들이 파일 형식별로 파일 정보를 집계, 분석해 회사의 보존 및 무단 사용 정책을 더욱 효율적으로 적용하는 감시자 역할을 해야 한다.
 

X