2013.11.04

"빅 데이터 분석 위해 하둡과 다른 시스템 함께 사용" IDC

Antony Savvas | Computerworld UK
기업들의 하둡 도입 현황이 복잡한 것으로 조사됐다.

IDC의 조사에 따르면, 기업들이 데이터에서 가치를 얻고자 다른 시스템과 함께 오픈소스 하둡 빅 데이터 분석 시스템을 사용하는 것으로 나타났다.

이 조사는 레드햇의 의뢰로 IDC가 실시했으며 IDC는 '기업의 하둡 도입 동향’이라는 보고고서에서, 조사 응답 기업의 32%가 하둡을 도입했다고 밝혔다. 응답 기업 31%는 12개월 이내에 하둡을 도입할 계획이며 36%는 12월 이후에 하둡을 도입할 예정인 것으로 조사됐다.

이 보고서에 따르면, 기업들이 빅 데이터 분석을 위해 하둡과 다른 데이터베이스를 결합하는 것으로 나타났다. 응답 기업의 약 39%는 H베이스(HBase)와 카산드라, 몽고DB같은 NoSQL 데이터베이스를 사용하며 약 36%는 그린플럼과 버티카(Vertica) 같은 MPP 데이터베이스를 사용한다고 말했다.

"이는 기존의 정형 데이터 세트를 최근의 소스에서 비정형 데이터와 함께 분석할 때 인과관계와 상관관계가 얼마나 중요한 지를 보여주고 있다”라고 이 보고서는 전했다.

지난 주 초 뉴욕 기자회견에서 페이스북 분석 담당 수석인 켄 루딘이 빅 데이터를 활용하고자 하는 기업들에게 하둡만으로는 충분치 않다고 지적했던 점도 언급했는데 이 보고서 역시 같은 주장을 내세웠다.

IDC의 보고서는 기업들이 하둡을 사용하는 여러 가지 방법을 보여주고 있다. 원시 데이터의 분석을 포함해, IT운영 여부 데이터, 기계 또는 POS시스템이나 전자상거래나 소매 시스템에서 수집된 고객의 행동 데이터 관점에서 본 데이터들을 대상으로 한 것들이었다.

응답자 중 39%는 제품과 서비스에 대해 ‘만약 그렇다면’ 시나리오라는 모델링으로 보조 데이터 세트의 분석을 포함한 서비스 혁신을 위해 하둡을 사용한다고 말했다.

IDC는 기업들이 영구 스토리지 시스템을 위한 대안을 찾고 있다고 전했다. 강력한 스케일 아웃 기능을 가진 것으로 알려 IBM 의 글로벌 파일 시스템(GPFS), 레드햇 스토리지(GlusterFS), EMC 아이실론 원FS 등의 파일시스템은 하둡분산 파일시스템(HDFS)의 대안으로 기업들이 선호하는 제품이라고 보고서는 덧붙였다.

이밖에 IDC의 보고서는 대부분의 기업들이 하둡 처리 전후에 빅 데이터를 분석한다고 밝혔다. "이는 원시 POSIX 형식으로 데이터를 유지하고 기존의 분석 도구를 사용하는 기능을 포함해 다른 스토리지 대안의 또 다른 매력적인 기능을 필요로 함을 보여준다"라고 IDC는 전했다. ciokr@idg.co.kr



2013.11.04

"빅 데이터 분석 위해 하둡과 다른 시스템 함께 사용" IDC

Antony Savvas | Computerworld UK
기업들의 하둡 도입 현황이 복잡한 것으로 조사됐다.

IDC의 조사에 따르면, 기업들이 데이터에서 가치를 얻고자 다른 시스템과 함께 오픈소스 하둡 빅 데이터 분석 시스템을 사용하는 것으로 나타났다.

이 조사는 레드햇의 의뢰로 IDC가 실시했으며 IDC는 '기업의 하둡 도입 동향’이라는 보고고서에서, 조사 응답 기업의 32%가 하둡을 도입했다고 밝혔다. 응답 기업 31%는 12개월 이내에 하둡을 도입할 계획이며 36%는 12월 이후에 하둡을 도입할 예정인 것으로 조사됐다.

이 보고서에 따르면, 기업들이 빅 데이터 분석을 위해 하둡과 다른 데이터베이스를 결합하는 것으로 나타났다. 응답 기업의 약 39%는 H베이스(HBase)와 카산드라, 몽고DB같은 NoSQL 데이터베이스를 사용하며 약 36%는 그린플럼과 버티카(Vertica) 같은 MPP 데이터베이스를 사용한다고 말했다.

"이는 기존의 정형 데이터 세트를 최근의 소스에서 비정형 데이터와 함께 분석할 때 인과관계와 상관관계가 얼마나 중요한 지를 보여주고 있다”라고 이 보고서는 전했다.

지난 주 초 뉴욕 기자회견에서 페이스북 분석 담당 수석인 켄 루딘이 빅 데이터를 활용하고자 하는 기업들에게 하둡만으로는 충분치 않다고 지적했던 점도 언급했는데 이 보고서 역시 같은 주장을 내세웠다.

IDC의 보고서는 기업들이 하둡을 사용하는 여러 가지 방법을 보여주고 있다. 원시 데이터의 분석을 포함해, IT운영 여부 데이터, 기계 또는 POS시스템이나 전자상거래나 소매 시스템에서 수집된 고객의 행동 데이터 관점에서 본 데이터들을 대상으로 한 것들이었다.

응답자 중 39%는 제품과 서비스에 대해 ‘만약 그렇다면’ 시나리오라는 모델링으로 보조 데이터 세트의 분석을 포함한 서비스 혁신을 위해 하둡을 사용한다고 말했다.

IDC는 기업들이 영구 스토리지 시스템을 위한 대안을 찾고 있다고 전했다. 강력한 스케일 아웃 기능을 가진 것으로 알려 IBM 의 글로벌 파일 시스템(GPFS), 레드햇 스토리지(GlusterFS), EMC 아이실론 원FS 등의 파일시스템은 하둡분산 파일시스템(HDFS)의 대안으로 기업들이 선호하는 제품이라고 보고서는 덧붙였다.

이밖에 IDC의 보고서는 대부분의 기업들이 하둡 처리 전후에 빅 데이터를 분석한다고 밝혔다. "이는 원시 POSIX 형식으로 데이터를 유지하고 기존의 분석 도구를 사용하는 기능을 포함해 다른 스토리지 대안의 또 다른 매력적인 기능을 필요로 함을 보여준다"라고 IDC는 전했다. ciokr@idg.co.kr

X