2011.11.10

전문가들, 하둡의 보안 이슈 제기

Jaikumar Vijayan | Computerworld
이번 주 열린 하둡 월드 컨퍼런스에서 CIO들이 하둡을 사용하기 전에 잠재적인 보안 이슈를 점검할 필요가 있다는 의견이 애널리스트와 IT전문가들 사이에서 제기됐다. 하둡은 다양하고 분산된 소스에서 모은 데이터를 가공하기 위해 쓰이는데, 이 과정에서 접근 통제와 데이터 권한 문제를 야기할 수 있다는 것이다.

오픈소스 기술 하둡은 기업 데이터 저장소뿐 아니라 웹로그, 온라인 트랜잭션 및 소셜 미디어의 정형 및 비정형 데이터의 거대한 양을 취합하고, 가공하며, 공유하고 분석하게 해준다.

점점 더 많은 기업들이 하둡과 하이브(Hive), 피그(Pig), H베이스(Hbase) 등의 관련 기술을 사용하고 있다. 이 새로운 기술들은 전통적인 관계형DB(RDBMS)에서는 분석할 수 없었던 비정형 데이터 분석을 가능하게 해주기 때문이다.

컨퍼런스에 참석한 기업 중 하나인 JP모건체이스(JPMorgan Chase)의 경우, 부정행위 찾아내기, IT리스크 관리, 셀프서비스 애플리케이션을 개선하기 위해 하둡을 사용하고 있다. JP모건체이스는 고객을 좀더 포괄적으로 바라보고자 했다.

이베이의 경우, 경매 사이트에 새로운 검색 엔진을 구축하기 위해 하둡과 H베이스 오픈소스 DB를 도입했다.

애널리스트들은 그러한 기능을 위해 하둡을 사용할 경우, 보안 문제가 발생 가능성을 인지해야 한다고 입을 모았다.

JP모건체이스의 IT운영 담당 이사 래리 페인스미스는 “다양한 정보원에서 데이터를 가져와 가공하고 저장하는 기술을 사용하기 때문에 접근 통제와 관리뿐 아니라 데이터 권한과 소유 관련 문제도 발생할 수 있다”라고 말했다.

하둡 환경은 기밀 데이터로 분류됐던 것들을 한 데 모아놓기도 해 보안 문제가 민감해 질 수 밖에 없다고 연방정부에 IT서비스를 제공하는 업체 베리코 테크놀로지(Berico Technologies)의 소프트웨어 엔지니어 리차드 클레이튼은 말했다.

클레이튼은 “기업의 경우, 직책에 따라 데이터에 접근할 수 있도록 고유한 보안 통제를 반드시 구축해야 한다”라고 덧붙였다.

그는 또 데이터를 하나의 환경에 맞게 가공하는 것도 데이터 도난 및 유출 사고에 대한 위험을 높일 수 있다고 경고했다.

클레이튼에 따르면, 하둡 환경에서 통합된 데이터를 분석하는 애플리케이션은 새로운 데이터 세트의 생성을 만들 수 있는데 이 또한 보호해야 한다는 것이다.

많은 정부 기관들은 하둡에 저장된 데이터를 따로 보관하고 있다고 클레이튼은 말했다.

“몇몇 공공 기관들은 데이터 접근 우려 때문에 민감한 데이터를 하둡 데이터베이스에 저장하지 않을 것이다. 또 다른 몇몇 공공 기관들은 간단한 방법으로 하둡 환경을 보호할 방화벽을 구축하고 있다”라고 그는 덧붙였다.

많은 하둡 사용자들에게 가장 효율적인 보안 접근은 각각의 기록 단계에서 데이터를 암호화하는 것이다.

클레이튼은 기업이 하둡 사용에 대해 좀더 유의해야 한다고 조언했다. 그에 따르면, 액세스 컨트롤 리스트(Access Control Lists)와 커버러스(Kerberos)와 같은 하둡 분산 파일 시스템(HDFS)에 장착된 보안 기능들이 기업의 요구에 부합하지 않는 수준이다.

벤타나 리서치(Ventana Research)의 애널리스트 데이빗 메닝거에 따르면, 보안과 접근 통제가 문제가 되는 것은 하둡이 아직 기업에서 관계형DBMS를 대체할 준비가 돼 있지 않다는 것을 의미한다.

빅 데이터 환경에서 통합 접근 관리 기술을 제공하는 애티비오(Attivio)의 CTO 시드 프롭스테인도 매닝거의 의견에 동의했다. “하둡이 훌륭한 기술이지만 기업들의 전반적인 준비는 미흡한 수준이다”라고 프롭스테인은 주장했다. ciokr@idg.co.kr



2011.11.10

전문가들, 하둡의 보안 이슈 제기

Jaikumar Vijayan | Computerworld
이번 주 열린 하둡 월드 컨퍼런스에서 CIO들이 하둡을 사용하기 전에 잠재적인 보안 이슈를 점검할 필요가 있다는 의견이 애널리스트와 IT전문가들 사이에서 제기됐다. 하둡은 다양하고 분산된 소스에서 모은 데이터를 가공하기 위해 쓰이는데, 이 과정에서 접근 통제와 데이터 권한 문제를 야기할 수 있다는 것이다.

오픈소스 기술 하둡은 기업 데이터 저장소뿐 아니라 웹로그, 온라인 트랜잭션 및 소셜 미디어의 정형 및 비정형 데이터의 거대한 양을 취합하고, 가공하며, 공유하고 분석하게 해준다.

점점 더 많은 기업들이 하둡과 하이브(Hive), 피그(Pig), H베이스(Hbase) 등의 관련 기술을 사용하고 있다. 이 새로운 기술들은 전통적인 관계형DB(RDBMS)에서는 분석할 수 없었던 비정형 데이터 분석을 가능하게 해주기 때문이다.

컨퍼런스에 참석한 기업 중 하나인 JP모건체이스(JPMorgan Chase)의 경우, 부정행위 찾아내기, IT리스크 관리, 셀프서비스 애플리케이션을 개선하기 위해 하둡을 사용하고 있다. JP모건체이스는 고객을 좀더 포괄적으로 바라보고자 했다.

이베이의 경우, 경매 사이트에 새로운 검색 엔진을 구축하기 위해 하둡과 H베이스 오픈소스 DB를 도입했다.

애널리스트들은 그러한 기능을 위해 하둡을 사용할 경우, 보안 문제가 발생 가능성을 인지해야 한다고 입을 모았다.

JP모건체이스의 IT운영 담당 이사 래리 페인스미스는 “다양한 정보원에서 데이터를 가져와 가공하고 저장하는 기술을 사용하기 때문에 접근 통제와 관리뿐 아니라 데이터 권한과 소유 관련 문제도 발생할 수 있다”라고 말했다.

하둡 환경은 기밀 데이터로 분류됐던 것들을 한 데 모아놓기도 해 보안 문제가 민감해 질 수 밖에 없다고 연방정부에 IT서비스를 제공하는 업체 베리코 테크놀로지(Berico Technologies)의 소프트웨어 엔지니어 리차드 클레이튼은 말했다.

클레이튼은 “기업의 경우, 직책에 따라 데이터에 접근할 수 있도록 고유한 보안 통제를 반드시 구축해야 한다”라고 덧붙였다.

그는 또 데이터를 하나의 환경에 맞게 가공하는 것도 데이터 도난 및 유출 사고에 대한 위험을 높일 수 있다고 경고했다.

클레이튼에 따르면, 하둡 환경에서 통합된 데이터를 분석하는 애플리케이션은 새로운 데이터 세트의 생성을 만들 수 있는데 이 또한 보호해야 한다는 것이다.

많은 정부 기관들은 하둡에 저장된 데이터를 따로 보관하고 있다고 클레이튼은 말했다.

“몇몇 공공 기관들은 데이터 접근 우려 때문에 민감한 데이터를 하둡 데이터베이스에 저장하지 않을 것이다. 또 다른 몇몇 공공 기관들은 간단한 방법으로 하둡 환경을 보호할 방화벽을 구축하고 있다”라고 그는 덧붙였다.

많은 하둡 사용자들에게 가장 효율적인 보안 접근은 각각의 기록 단계에서 데이터를 암호화하는 것이다.

클레이튼은 기업이 하둡 사용에 대해 좀더 유의해야 한다고 조언했다. 그에 따르면, 액세스 컨트롤 리스트(Access Control Lists)와 커버러스(Kerberos)와 같은 하둡 분산 파일 시스템(HDFS)에 장착된 보안 기능들이 기업의 요구에 부합하지 않는 수준이다.

벤타나 리서치(Ventana Research)의 애널리스트 데이빗 메닝거에 따르면, 보안과 접근 통제가 문제가 되는 것은 하둡이 아직 기업에서 관계형DBMS를 대체할 준비가 돼 있지 않다는 것을 의미한다.

빅 데이터 환경에서 통합 접근 관리 기술을 제공하는 애티비오(Attivio)의 CTO 시드 프롭스테인도 매닝거의 의견에 동의했다. “하둡이 훌륭한 기술이지만 기업들의 전반적인 준비는 미흡한 수준이다”라고 프롭스테인은 주장했다. ciokr@idg.co.kr

X