2015.09.24

구글, 분 단위 과금하는 클라우드 데이터프로크 출시

Katherine Noyes | IDG News Service
구글이 분 단위로 과금하는 '클라우드 데이터프로크'를 출시했다. 


이미지 출처 : Google

구글이 내놓은 데이터프로크(Cloud Dataproc)는 구글이 기존의 자사 클라우드 서비스를 바꿀 목적으로 하둡과 스파크를 위해 개발한 새로운 관리 서비스다. 

23일 구글이 공개한 베타 서비스인 클라우드 데이터프로크는 빅데이터 포트폴리오의 새로운 부분으로 기업들이 고객들을 신속하게 만들어 내고 쉽게 관리하며 필요치 않을 때는 삭제할 수 있도록 고안됐다.

콘스텔레이션 리서치의 수석 애널리스트 겸 부사장인 홀저 뮬러는 "기업들이 빠르게 발전하는 빅데이터 기술에서 효과를 극대화하고자 분투하고 있다"고 말했다. 그는 이어서 "일반 기업이 빅데이터를 도입하고 운영하는 것은 쉬운 일이 아니다"며 "2개의 오픈소스 제품을 결합해야 할 경우 상황이 더 복잡해질 수 있다"고 덧붙였다.

하둡과 스파크 클러스터를 쉽게 구현하고 운영할 수 있는 방법이 있다면, 그것은 확실히 기업에 가치 있을 수 있다고 그는 전했다. 하지만 구글의 클라우드 데이터프로크는 궁극적으로 더 많은 부하를 처리하고, 더 많이 사용할 수 있으며, 더 많은 고객 데이터를 처리할 수 있음을 의미하며 이는 더 큰 규모의 경제를 창출한다고 뮬러는 밝혔다.

클라우드 데이터프로크는 기존 온프레미스 제품과 경쟁하는 모든 클라우드 서비스에 많은 혜택을 제공하고 있다며 구글은 전했다. 

예를 들어, 온-프레미스나 IaaS 업체를 통해서 스파크와 하둡 클러스터를 만들어 내는데 걸리는 시간이 5~30분 정도라면 클라우드 데이터프로크의 경우 평균 90초 이내의 시간이 소요된다는 것이다. 이는 사용자가 자신의 데이터를 가지고 통찰력을 얻는데 더 많은 시간을 할애할 수 있음을 의미할 수 있다. 

"온프레미스나 클라우드 중 하나에서 자가 관리 설치로 할 경우 클러스터에 대한 시간을 효과적으로 사용하게 된다"고 구글 클라우드 플랫폼 제품 관리 이사인 그렉 드미칠리는 말했다. 이어서 그는 "클라우드 데이터프로크는 당신이 쿼리를 던져 인사이트를 얻을 때까지의 시간을 단축시켜줄 것이다"고 덧붙였다. 

비용은 클러스터의 가상 CPU 1대를 1시간 사용할 경우 1센트며 클라우드 데이터프로크 클러스터에는 더 저렴한 컴퓨팅 가격 정책인 선불제가 포함돼 있고 추가 비용도 아낄 수 있다. 많은 클라우드 업체들은 거의 시간 단위로 과금하고 있는데 클라우드 데이터프로크는 분단위 과금을 사용하며 10분 단위로 나눠서 비용을 청구하는 것이 특징이다.

클라우드 데이터프로크는 빅쿼리, 클라우드 스토리지, 클라우드 빅테이블(Bigtable), 클라우드 로깅, 클라우드 모니터링 등 구글 클라우드 플랫폼 서비스와 통합돼 제공될 수도 있다. 예를 들어 기업은 수 테라바이트에 달라는 로그 데이터를 추출해 변환하고 기업 보고서용 빅쿼리로 직접 로딩하는데 이를 사용할 수 있다.
 
구글이 이 서비스를 관리해 주기 때문에 기업은 관리자나 특정 소프트웨어의 도움없이 스파크와 하둡 클러스터를 사용할 수 있다고 구글은 전했다. 구글 개발자 콘솔, 구글 클라우드 SDK나 클라우드 데이터프로크 REST API를 통해 클러스터와 스파크나 하둡 작업과 상호작용할 수 있다. 이것들이 클러스터 안에서 실행되면, 기업은 비용 낭비를 피할 수 있다. 

현재 클라우드 데이터프로크는 스파크 1.5와 하둡 2.7.1을 기본으로 한 클러스터를 제공하고 있다. ciokr@idg.co.kr



2015.09.24

구글, 분 단위 과금하는 클라우드 데이터프로크 출시

Katherine Noyes | IDG News Service
구글이 분 단위로 과금하는 '클라우드 데이터프로크'를 출시했다. 


이미지 출처 : Google

구글이 내놓은 데이터프로크(Cloud Dataproc)는 구글이 기존의 자사 클라우드 서비스를 바꿀 목적으로 하둡과 스파크를 위해 개발한 새로운 관리 서비스다. 

23일 구글이 공개한 베타 서비스인 클라우드 데이터프로크는 빅데이터 포트폴리오의 새로운 부분으로 기업들이 고객들을 신속하게 만들어 내고 쉽게 관리하며 필요치 않을 때는 삭제할 수 있도록 고안됐다.

콘스텔레이션 리서치의 수석 애널리스트 겸 부사장인 홀저 뮬러는 "기업들이 빠르게 발전하는 빅데이터 기술에서 효과를 극대화하고자 분투하고 있다"고 말했다. 그는 이어서 "일반 기업이 빅데이터를 도입하고 운영하는 것은 쉬운 일이 아니다"며 "2개의 오픈소스 제품을 결합해야 할 경우 상황이 더 복잡해질 수 있다"고 덧붙였다.

하둡과 스파크 클러스터를 쉽게 구현하고 운영할 수 있는 방법이 있다면, 그것은 확실히 기업에 가치 있을 수 있다고 그는 전했다. 하지만 구글의 클라우드 데이터프로크는 궁극적으로 더 많은 부하를 처리하고, 더 많이 사용할 수 있으며, 더 많은 고객 데이터를 처리할 수 있음을 의미하며 이는 더 큰 규모의 경제를 창출한다고 뮬러는 밝혔다.

클라우드 데이터프로크는 기존 온프레미스 제품과 경쟁하는 모든 클라우드 서비스에 많은 혜택을 제공하고 있다며 구글은 전했다. 

예를 들어, 온-프레미스나 IaaS 업체를 통해서 스파크와 하둡 클러스터를 만들어 내는데 걸리는 시간이 5~30분 정도라면 클라우드 데이터프로크의 경우 평균 90초 이내의 시간이 소요된다는 것이다. 이는 사용자가 자신의 데이터를 가지고 통찰력을 얻는데 더 많은 시간을 할애할 수 있음을 의미할 수 있다. 

"온프레미스나 클라우드 중 하나에서 자가 관리 설치로 할 경우 클러스터에 대한 시간을 효과적으로 사용하게 된다"고 구글 클라우드 플랫폼 제품 관리 이사인 그렉 드미칠리는 말했다. 이어서 그는 "클라우드 데이터프로크는 당신이 쿼리를 던져 인사이트를 얻을 때까지의 시간을 단축시켜줄 것이다"고 덧붙였다. 

비용은 클러스터의 가상 CPU 1대를 1시간 사용할 경우 1센트며 클라우드 데이터프로크 클러스터에는 더 저렴한 컴퓨팅 가격 정책인 선불제가 포함돼 있고 추가 비용도 아낄 수 있다. 많은 클라우드 업체들은 거의 시간 단위로 과금하고 있는데 클라우드 데이터프로크는 분단위 과금을 사용하며 10분 단위로 나눠서 비용을 청구하는 것이 특징이다.

클라우드 데이터프로크는 빅쿼리, 클라우드 스토리지, 클라우드 빅테이블(Bigtable), 클라우드 로깅, 클라우드 모니터링 등 구글 클라우드 플랫폼 서비스와 통합돼 제공될 수도 있다. 예를 들어 기업은 수 테라바이트에 달라는 로그 데이터를 추출해 변환하고 기업 보고서용 빅쿼리로 직접 로딩하는데 이를 사용할 수 있다.
 
구글이 이 서비스를 관리해 주기 때문에 기업은 관리자나 특정 소프트웨어의 도움없이 스파크와 하둡 클러스터를 사용할 수 있다고 구글은 전했다. 구글 개발자 콘솔, 구글 클라우드 SDK나 클라우드 데이터프로크 REST API를 통해 클러스터와 스파크나 하둡 작업과 상호작용할 수 있다. 이것들이 클러스터 안에서 실행되면, 기업은 비용 낭비를 피할 수 있다. 

현재 클라우드 데이터프로크는 스파크 1.5와 하둡 2.7.1을 기본으로 한 클러스터를 제공하고 있다. ciokr@idg.co.kr

X