Offcanvas

���������

칼럼 | 클라우드 데이터 웨어하우스의 미래

지난 5년 동안 우리는 스노우플레이크(Snowflake)와 빅쿼리(BigQuery)로 대표되는 클라우드 데이터 웨어하우스가 수많은 데이터를 결합하고 분석해야 하는 기업에 지배적인 툴이 되어가는 과정을 목격했다. 초기 데이터 웨어하우스는 매출이나 고객 수, 각 지표의 변화 추이 및 원인 파악 등 기업의 전형적인 의사결정을 지원하는 데 활용됐다.   하지만 데이터가 워크로드를 끌어당기는 것이 데이터베이스의 철칙이다. 모든 데이터를 한 곳에 모으면, 팀 내 똑똑한 직원이 예상치도 못한 데이터 활용 방법을 생각해내기 마련이다. 클라우드 데이터 웨어하우스는 새로운 사용 사례를 ‘탄력성(elasticity)’이라는 특징으로 실현한다. 데이터를 활용하는 새로운 방법을 발견하면 새로운 컴퓨팅 자원을 제한없이 추가한다. 가끔 데이터 웨어하우스에 최적화된 일반적인 분석 쿼리와 새로운 워크로드의 형태가 다른 경우가 있다. 지난 20년간 상용 데이터 웨어하우스는 소수의 대형 쿼리를 처리하는 데 최적화되어 있었다. 전체 테이블을 스캔해 요약 통계를 집계하는 방식이다. 예컨대 상용 데이터 웨어하우스는 다음과 같은 쿼리에 최적화됐다.    지난 1년 동안 각 지역에서 매월 확보한 신규 회원 수 그러나 다음과 같은 질문에는 최적화되어 있지 않다.   특정 고객 한 명과 주고받은 모든 상호작용 이런 쿼리는 많은 데이터 소스를 한 곳에 배치한 뒤 특정 소스의 데이터 가운데 아주 적은 비율만 처리해야 한다. 분석적 특성과 운영적 특성을 모두 포함하고 있으며, 클라우드 데이터 웨어하우스가 보편화되면서 등장한 워크로드의 대표적인 유형이다. 주요 데이터 웨어하우스 서비스 업체는 이런 유형의 쿼리를 보다 효과적으로 지원하기 위해 변화를 시도하고 있다. 스노우플레이크는 최근 데이터 웨어하우스에 인덱스를 만드는 검색 최적화 서비스를 출시했다. 현재 인덱스 기능은 운영 데이터베이스 어디에나 존재하지만, 과거에는 데이터 웨어하우스가 분석 워크로드와 무...

데이터웨어하우스 스노우플레이크 빅쿼리

2021.12.20

지난 5년 동안 우리는 스노우플레이크(Snowflake)와 빅쿼리(BigQuery)로 대표되는 클라우드 데이터 웨어하우스가 수많은 데이터를 결합하고 분석해야 하는 기업에 지배적인 툴이 되어가는 과정을 목격했다. 초기 데이터 웨어하우스는 매출이나 고객 수, 각 지표의 변화 추이 및 원인 파악 등 기업의 전형적인 의사결정을 지원하는 데 활용됐다.   하지만 데이터가 워크로드를 끌어당기는 것이 데이터베이스의 철칙이다. 모든 데이터를 한 곳에 모으면, 팀 내 똑똑한 직원이 예상치도 못한 데이터 활용 방법을 생각해내기 마련이다. 클라우드 데이터 웨어하우스는 새로운 사용 사례를 ‘탄력성(elasticity)’이라는 특징으로 실현한다. 데이터를 활용하는 새로운 방법을 발견하면 새로운 컴퓨팅 자원을 제한없이 추가한다. 가끔 데이터 웨어하우스에 최적화된 일반적인 분석 쿼리와 새로운 워크로드의 형태가 다른 경우가 있다. 지난 20년간 상용 데이터 웨어하우스는 소수의 대형 쿼리를 처리하는 데 최적화되어 있었다. 전체 테이블을 스캔해 요약 통계를 집계하는 방식이다. 예컨대 상용 데이터 웨어하우스는 다음과 같은 쿼리에 최적화됐다.    지난 1년 동안 각 지역에서 매월 확보한 신규 회원 수 그러나 다음과 같은 질문에는 최적화되어 있지 않다.   특정 고객 한 명과 주고받은 모든 상호작용 이런 쿼리는 많은 데이터 소스를 한 곳에 배치한 뒤 특정 소스의 데이터 가운데 아주 적은 비율만 처리해야 한다. 분석적 특성과 운영적 특성을 모두 포함하고 있으며, 클라우드 데이터 웨어하우스가 보편화되면서 등장한 워크로드의 대표적인 유형이다. 주요 데이터 웨어하우스 서비스 업체는 이런 유형의 쿼리를 보다 효과적으로 지원하기 위해 변화를 시도하고 있다. 스노우플레이크는 최근 데이터 웨어하우스에 인덱스를 만드는 검색 최적화 서비스를 출시했다. 현재 인덱스 기능은 운영 데이터베이스 어디에나 존재하지만, 과거에는 데이터 웨어하우스가 분석 워크로드와 무...

2021.12.20

구글, 논리형 언어 '로지카 공개'··· 수학 명제로 코딩· SQL 결함 해결

오픈소스 기반 논리형 프로그래밍 언어인 로지카는 SQL로 컴파일이 가능하며 구글 빅쿼리에서 실행된다. 포스트그리 SQL과 SQ 라이트를 시범적으로 지원한다.  구글이 오픈소스 기반 프로그래밍 언어인 로지카(Logica)를 공개했다. 이는 자연어 대신 수학적 명제 논리로 짜인 구문을 이용해 SQL의 각종 문제를 해결할 수 있도록 고안됐다.    12일(현지시간) 구글 예달로그(Yedalog) 언어의 후속작으로 소개된 로지카는 데이터 로직류(Datalogic-like)의 논리형 언어이다. 엔지니어, 데이터 과학자 및 기타 전문가를 위해 개발된 이 언어는 코드를 SQL로 컴파일 가능하며, 클라우드 기반 데이터 웨어하우스인 구글 빅쿼리에서 실행된다. 또 포스트그리 SQL과 SQ 라이트를 시범적으로 지원한다. 이 밖에도 로지카는 훨씬 간결하며, SQL과 달리 재사용 가능한 추상화(reusable abstractions)를 지원한다. 구글 디벨로퍼스 블로그에 따르면, 로지카는 모듈과 가져오기를 지원하며, 대화형 파이썬 노트북에서 사용할 수 있고, 쉬우면서 자연스러운 쿼리 테스트도 가능하다. 구글에 따르면 로지카는 일반적인 영어가 아니라 수학적 논리 구문을 이용하는 방식을 채택하고 있어 SQL의 여러 문제를 해결할 수 있다. SQL은 영단어로 문장을 구성할 때 장황해지거나 추상화 지원이 제한되는 등의 문제가 있다. 로지카는 특히 집합(aggregation)을 통해 고전적인 논리형 프로그래밍 구문을 확장시킨다. 데이터 조작에 적합한 선언형 언어로 분류된다.  로지카 오픈소스 프로젝트를 맡고 있는 구글 디벨로퍼스는 다음과 같은 상황에서 로지카를 사용해볼 것을 권장했다.   논리형 프로그래밍이 이미 사용되고 있지만 컴퓨팅 파워가 더 많이 필요한 경우 SQL이 사용되고 있지만 SQL의 가독성이 만족스럽지 않은 경우 논리형 프로그래밍을 학습하여 빅데이터 처리에 적용하고자 하는 경우 구글은 로지카를 ...

구글 빅쿼리 로지카 SQL 논리형 언어 오픈소스 빅데이터

2021.04.16

오픈소스 기반 논리형 프로그래밍 언어인 로지카는 SQL로 컴파일이 가능하며 구글 빅쿼리에서 실행된다. 포스트그리 SQL과 SQ 라이트를 시범적으로 지원한다.  구글이 오픈소스 기반 프로그래밍 언어인 로지카(Logica)를 공개했다. 이는 자연어 대신 수학적 명제 논리로 짜인 구문을 이용해 SQL의 각종 문제를 해결할 수 있도록 고안됐다.    12일(현지시간) 구글 예달로그(Yedalog) 언어의 후속작으로 소개된 로지카는 데이터 로직류(Datalogic-like)의 논리형 언어이다. 엔지니어, 데이터 과학자 및 기타 전문가를 위해 개발된 이 언어는 코드를 SQL로 컴파일 가능하며, 클라우드 기반 데이터 웨어하우스인 구글 빅쿼리에서 실행된다. 또 포스트그리 SQL과 SQ 라이트를 시범적으로 지원한다. 이 밖에도 로지카는 훨씬 간결하며, SQL과 달리 재사용 가능한 추상화(reusable abstractions)를 지원한다. 구글 디벨로퍼스 블로그에 따르면, 로지카는 모듈과 가져오기를 지원하며, 대화형 파이썬 노트북에서 사용할 수 있고, 쉬우면서 자연스러운 쿼리 테스트도 가능하다. 구글에 따르면 로지카는 일반적인 영어가 아니라 수학적 논리 구문을 이용하는 방식을 채택하고 있어 SQL의 여러 문제를 해결할 수 있다. SQL은 영단어로 문장을 구성할 때 장황해지거나 추상화 지원이 제한되는 등의 문제가 있다. 로지카는 특히 집합(aggregation)을 통해 고전적인 논리형 프로그래밍 구문을 확장시킨다. 데이터 조작에 적합한 선언형 언어로 분류된다.  로지카 오픈소스 프로젝트를 맡고 있는 구글 디벨로퍼스는 다음과 같은 상황에서 로지카를 사용해볼 것을 권장했다.   논리형 프로그래밍이 이미 사용되고 있지만 컴퓨팅 파워가 더 많이 필요한 경우 SQL이 사용되고 있지만 SQL의 가독성이 만족스럽지 않은 경우 논리형 프로그래밍을 학습하여 빅데이터 처리에 적용하고자 하는 경우 구글은 로지카를 ...

2021.04.16

‘인 데이터베이스’ 머신러닝 지원하는 데이터베이스 8종

2020년 8월 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’이라는 글에서 플랫폼 선택의 첫 번째 가이드라인으로 ‘데이터에 가까이 다가가기’를 제시했다. 빛의 속도가 전송 속도를 제한하기 때문에 지연을 낮게 유지하기 위해 데이터 근처에 코드를 존재하는 것이 바람직하다. 머신러닝의 경우 모든 데이터를 여러 차례 검토하는 경향이 있다는 점을 감안하면 더욱 그렇다(각각의 검토 과정을 에포크(Epoch)라고 지칭된다). 필자는 당시 큰 데이터 세트를 데이터가 이미 위치한 장소에 모델을 구축함으로써, 대량의 데이터 전송을 불필요하게 만드는 것이 좋다고 설명했다. 몇몇 데이터베이스가 제한된 범위에서 이러한 콘셉트를 지원한다. 그렇다면 내부 머신러닝을 지원하는 데이터베이스는 무엇일까? 어떤 방법으로 이를 지원할까? 이런 데이터베이스를 알파벳 순으로 소개한다.   아마존 레드시프트 아마존 레드시프트는 기존 비즈니스 인텔리전스 도구를 이용해 데이터를 쉽게, 비용 효과적으로 분석할 수 있도록 설계된 관리형 페타바이트급 데이터 웨어하우스 서비스이다. 몇 백 기가바이트에서 1 페타바이트까지 다양한 크기의 데이터세트에 최적화되어 있고, 비용은 연간 테라바이트 당 1,000달러 미만이다. 아마존 레드시프트 머신러닝은 SQL 사용자가 SQL 명령을 사용하여 쉽게 머신러닝 모델을 만들고, 트레이닝하고, 배포할 수 있도록 설계되어 있다. 레드시프트 SQL의 CREATE MODEL 명령은 트레이닝과 대상 열에 사용할 데이터를 정의하고, 동일한 구역의 암호화된 아마존 S3 버킷을 통해 아마존 세이지메이커 오토파일럿로 보내 트레이닝을 한다. 오토ML 트레이닝 후, 레드시프트 ML은 최상의 모델을 컴파일링하고, 사용자의 레드시프트 클러스터에 예측 SQL 함수로 등록한다. 그러면 사용자는 SELECT 구문 내 예측 함수를 호출하는 방법으로 추론을 위한 모델을 호출할 수 있다. 요약 : 레드시프트 ML은 세이지메이커 오토파일럿을 사용, 자동으로 SQL 구문을 통해 지정한 데이터...

머신러닝 데이터베이스 아마존 레드시프트 블레이징 빅쿼리 빅쿼리ML SQL 오라클

2021.02.19

2020년 8월 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’이라는 글에서 플랫폼 선택의 첫 번째 가이드라인으로 ‘데이터에 가까이 다가가기’를 제시했다. 빛의 속도가 전송 속도를 제한하기 때문에 지연을 낮게 유지하기 위해 데이터 근처에 코드를 존재하는 것이 바람직하다. 머신러닝의 경우 모든 데이터를 여러 차례 검토하는 경향이 있다는 점을 감안하면 더욱 그렇다(각각의 검토 과정을 에포크(Epoch)라고 지칭된다). 필자는 당시 큰 데이터 세트를 데이터가 이미 위치한 장소에 모델을 구축함으로써, 대량의 데이터 전송을 불필요하게 만드는 것이 좋다고 설명했다. 몇몇 데이터베이스가 제한된 범위에서 이러한 콘셉트를 지원한다. 그렇다면 내부 머신러닝을 지원하는 데이터베이스는 무엇일까? 어떤 방법으로 이를 지원할까? 이런 데이터베이스를 알파벳 순으로 소개한다.   아마존 레드시프트 아마존 레드시프트는 기존 비즈니스 인텔리전스 도구를 이용해 데이터를 쉽게, 비용 효과적으로 분석할 수 있도록 설계된 관리형 페타바이트급 데이터 웨어하우스 서비스이다. 몇 백 기가바이트에서 1 페타바이트까지 다양한 크기의 데이터세트에 최적화되어 있고, 비용은 연간 테라바이트 당 1,000달러 미만이다. 아마존 레드시프트 머신러닝은 SQL 사용자가 SQL 명령을 사용하여 쉽게 머신러닝 모델을 만들고, 트레이닝하고, 배포할 수 있도록 설계되어 있다. 레드시프트 SQL의 CREATE MODEL 명령은 트레이닝과 대상 열에 사용할 데이터를 정의하고, 동일한 구역의 암호화된 아마존 S3 버킷을 통해 아마존 세이지메이커 오토파일럿로 보내 트레이닝을 한다. 오토ML 트레이닝 후, 레드시프트 ML은 최상의 모델을 컴파일링하고, 사용자의 레드시프트 클러스터에 예측 SQL 함수로 등록한다. 그러면 사용자는 SELECT 구문 내 예측 함수를 호출하는 방법으로 추론을 위한 모델을 호출할 수 있다. 요약 : 레드시프트 ML은 세이지메이커 오토파일럿을 사용, 자동으로 SQL 구문을 통해 지정한 데이터...

2021.02.19

구글 클라우드, 파이썬 프로젝트에 35만 달러 후원

구글 클라우드(Google Cloud)가 C파이썬(CPython) 개발 지원, 기본 파이썬 도구 개선, 파이썬 패키지 에코시스템 보안 강화를 목표로 파이썬 소프트웨어 재단(Python Software Foundation, PSF)에 미화 35만 달러를 기부했다.    지난 2월 12일 구글 클라우드는 이번 후원을 통해 다음의 세 가지 프로젝트를 지원할 계획이라고 밝혔다.  • PyPI(Python Package Index) 저장소를 위한 프로덕션화된 멀웨어 탐지(구글 클라우드는 이 인덱스를 사용하여 텐서플로우(TensorFlow) 오픈소스 머신러닝 라이브러리를 포함한 수많은 클라이언트 라이브러리 및 개발자 도구를 배포한다).  • 파이썬 기본 서비스 및 도구 개선  • C파이썬 프로젝트의 유지 관리 우선순위를 지정하고 백로그를 해결하기 위해 풀타임으로 일할 C파이썬 전속 개발자(C파이썬은 파이썬 프로그래밍 언어의 참조 구현체다).  또한 회사에 따르면 구글 클라우드 퍼블릭 데이터세트(Google Cloud Public Datasets) 프로그램은 이제 거의 실시간으로 업데이트되는 PyPI 다운로드 통계 및 프로젝트 메타데이터의 새로운 퍼블릭 데이터세트를 제공한다. 구글 클라우드 계정 소유자는 빅쿼리(BigQuery) 데이터 웨어하우스 또는 빅쿼리 샌드박스(BigQuery Sandbox)를 사용하여 이러한 데이터세트를 쿼리할 수 있다.  구글 클라우드는 공식 블로그에서 “파이썬은 구글 클라우드와 고객 모두에게 매우 중요하다”라면서, “10년 전에 출시된 구글 앱 엔진(Google App Engine)과 같은 서비스형 플랫폼부터 구글 클라우드 펑션(Google Cloud Functions)을 포함한 최신 서버리스 제품에 이르기까지 많은 호스팅 서비스에서 인기 있는 런타임으로 사용되고 있기 때문이다”라고 말했다. ciokr@idg.co.kr  

구글 구글 클라우드 파이썬 C파이썬 PyPI 멀웨어 텐서플로우 빅쿼리 빅쿼리 샌드박스

2021.02.17

구글 클라우드(Google Cloud)가 C파이썬(CPython) 개발 지원, 기본 파이썬 도구 개선, 파이썬 패키지 에코시스템 보안 강화를 목표로 파이썬 소프트웨어 재단(Python Software Foundation, PSF)에 미화 35만 달러를 기부했다.    지난 2월 12일 구글 클라우드는 이번 후원을 통해 다음의 세 가지 프로젝트를 지원할 계획이라고 밝혔다.  • PyPI(Python Package Index) 저장소를 위한 프로덕션화된 멀웨어 탐지(구글 클라우드는 이 인덱스를 사용하여 텐서플로우(TensorFlow) 오픈소스 머신러닝 라이브러리를 포함한 수많은 클라이언트 라이브러리 및 개발자 도구를 배포한다).  • 파이썬 기본 서비스 및 도구 개선  • C파이썬 프로젝트의 유지 관리 우선순위를 지정하고 백로그를 해결하기 위해 풀타임으로 일할 C파이썬 전속 개발자(C파이썬은 파이썬 프로그래밍 언어의 참조 구현체다).  또한 회사에 따르면 구글 클라우드 퍼블릭 데이터세트(Google Cloud Public Datasets) 프로그램은 이제 거의 실시간으로 업데이트되는 PyPI 다운로드 통계 및 프로젝트 메타데이터의 새로운 퍼블릭 데이터세트를 제공한다. 구글 클라우드 계정 소유자는 빅쿼리(BigQuery) 데이터 웨어하우스 또는 빅쿼리 샌드박스(BigQuery Sandbox)를 사용하여 이러한 데이터세트를 쿼리할 수 있다.  구글 클라우드는 공식 블로그에서 “파이썬은 구글 클라우드와 고객 모두에게 매우 중요하다”라면서, “10년 전에 출시된 구글 앱 엔진(Google App Engine)과 같은 서비스형 플랫폼부터 구글 클라우드 펑션(Google Cloud Functions)을 포함한 최신 서버리스 제품에 이르기까지 많은 호스팅 서비스에서 인기 있는 런타임으로 사용되고 있기 때문이다”라고 말했다. ciokr@idg.co.kr  

2021.02.17

구글, 데이터 모델링 플랫폼 기업 '데이터폼' 인수

구글이 영국의 스타트업 데이터폼(Dataform)을 인수했다. 정확한 인수 가격은 공개되지 않았다. 영국 런던에서 3년 전 데이터폼을 공동 창립한 기욤 헨리 후온(Guillaume-Henri Huon)이 블로그를 통해 이러한 내용을 공개했다. 데이터폼은 앞으로 구글 클라우드를 통해 데이터폼 웹(Datafom Web)을 계속 제공하며, 2020년 12월 8일(현지 시각)부터 모든 신규 사용자에게 무료로 제공된다. 유료로 사용하던 기존 고객도 이제 무료로 사용할 수 있다.   다양한 원시 데이터를 신뢰할 수 있는 데이터 세트로 변환할 수 있다고 소개하는 데이터폼의 홈페이지(위). 빅쿼리 데이터 웨어하우스에서 데이터폼을 활용하면, 빠르고 간편하게 데이터를 변환할 수 있다(아래). (자료 : Google) 데이터폼 웹은 빅쿼리(BiqQuery) 지원에 중점을 두고 개발 및 운영에 중점을 둘 계획이다. 빅쿼리는 구글의 빅데이터 플랫폼으로 페타 바이트급의 데이터 저장과 분석을 제공하는, 완전 관리형 클라우드 서비스다. 기욤 후온은 "3년 전 우리는 데이터 분석가가 단일 통합 워크 플로를 사용하여, 웨어 하우스의 전체 데이터 흐름을 관리 할 수 있도록 지원한다는 사명으로 데이터폼을 시작했다. 그동안 원시 데이터를 가져와서 변환한 후 전달하는 데 필요한 도구를 제공하는 데 집중했다"라고 밝혔다. 그의 말처럼 데이터폼은 그동안 기업에서 생성 및 관리되는 다양한 데이터를, 더 저렴하고 더 빠르게 활용할 수 있는, 데이터 양식 빌드 도구를 개발해왔다. 기업에서 데이터는 의사 결정을 내리고 업무 프로세스를 관리하는 중요한 자원이다. 문제는 이러한 데이터를 유용한 자원으로 변환 또는 가공하기가 쉽지 않다는 것이다. 원시 데이터로부터 원하는 형태의 정보로 가공하기 위해서는, 데이터 관리 및 분석 전문가가 필요하다. 또한 많은 비용과 시간이 있어야 하는 경우가 적지 않다. 데이터폼은 이러한 원시 데이터를 저렴하고 효율적으로, 신뢰할 수 있는 문서로 만들어 진 최신 데...

구글 데이터폼 빅쿼리 데이터 모델링 데이터 워크플로우 원시 데이터

2020.12.10

구글이 영국의 스타트업 데이터폼(Dataform)을 인수했다. 정확한 인수 가격은 공개되지 않았다. 영국 런던에서 3년 전 데이터폼을 공동 창립한 기욤 헨리 후온(Guillaume-Henri Huon)이 블로그를 통해 이러한 내용을 공개했다. 데이터폼은 앞으로 구글 클라우드를 통해 데이터폼 웹(Datafom Web)을 계속 제공하며, 2020년 12월 8일(현지 시각)부터 모든 신규 사용자에게 무료로 제공된다. 유료로 사용하던 기존 고객도 이제 무료로 사용할 수 있다.   다양한 원시 데이터를 신뢰할 수 있는 데이터 세트로 변환할 수 있다고 소개하는 데이터폼의 홈페이지(위). 빅쿼리 데이터 웨어하우스에서 데이터폼을 활용하면, 빠르고 간편하게 데이터를 변환할 수 있다(아래). (자료 : Google) 데이터폼 웹은 빅쿼리(BiqQuery) 지원에 중점을 두고 개발 및 운영에 중점을 둘 계획이다. 빅쿼리는 구글의 빅데이터 플랫폼으로 페타 바이트급의 데이터 저장과 분석을 제공하는, 완전 관리형 클라우드 서비스다. 기욤 후온은 "3년 전 우리는 데이터 분석가가 단일 통합 워크 플로를 사용하여, 웨어 하우스의 전체 데이터 흐름을 관리 할 수 있도록 지원한다는 사명으로 데이터폼을 시작했다. 그동안 원시 데이터를 가져와서 변환한 후 전달하는 데 필요한 도구를 제공하는 데 집중했다"라고 밝혔다. 그의 말처럼 데이터폼은 그동안 기업에서 생성 및 관리되는 다양한 데이터를, 더 저렴하고 더 빠르게 활용할 수 있는, 데이터 양식 빌드 도구를 개발해왔다. 기업에서 데이터는 의사 결정을 내리고 업무 프로세스를 관리하는 중요한 자원이다. 문제는 이러한 데이터를 유용한 자원으로 변환 또는 가공하기가 쉽지 않다는 것이다. 원시 데이터로부터 원하는 형태의 정보로 가공하기 위해서는, 데이터 관리 및 분석 전문가가 필요하다. 또한 많은 비용과 시간이 있어야 하는 경우가 적지 않다. 데이터폼은 이러한 원시 데이터를 저렴하고 효율적으로, 신뢰할 수 있는 문서로 만들어 진 최신 데...

2020.12.10

5G 수익화부터 운영효율성 향상까지··· 구글, 통신사 지원 전략 발표 

구글 클라우드가 5G 수익화, 운영 효율성 향상, 데이터 기반 인사이트 제공을 골자로 하는 통신사 지원 전략을 발표했다.  구글 클라우드 CEO 토마스 쿠리안이 5일 자사 블로그를 통해 통신사 지원을 위한 3가지 전략 분야를 밝혔다. ▲비즈니스 서비스 플랫폼으로써 5G 수익 창출, ▲ 통신사 시스템 전반의 운영 효율성 개선, ▲데이터 중심 인사이트 제공이다.    5G 수익화 구글이 5G 수익 창출을 목적으로 선보인 것은 5G 솔루션을 포함하는 글로벌 모바일 엣지 클라우드(Global Mobile Edge Cloud, GMEC) 전략이다. 이 솔루션들은 전 세계적으로 배포될 계획이다.  일례로 구글은 미국 통신사 AT&T가 소매, 제조, 운송 업계에 5G 엣지 컴퓨팅 솔루션을 제공할 수 있도록 해당 통신사와 협력했다. AT&T 부사장이자 최고 마케팅 책임자(CMO) 모 카티베는 AT&T의 네트워크와 구글의 기술(AI, ML,쿠버네티스, 엣지 컴퓨팅)을 결합한 5G 솔루션을 선보일 것이라고 전했다.  이어서 그는 “차세대 클라우드 서비스를 제공하고자 구글 클라우드와 협력하고 있다”라며, “구글 클라우드의 엣지 컴퓨팅 기술과 5G를 결합하면, 클라우드의 잠재력이 발휘될 수 있다. 클라우드와 엣지 기술로 새로운 경험을 제공할 수 있는 단계에 가까워지고 있다”라고 덧붙였다.  또한 구글의 5G 수익화 계획에는 통신사에 클라우드 관리 플랫폼을 제공하는 안토스(Anthos) 솔루션의 새 버전도 포함돼 있다. 운영 효율성 향상  통신사의 운영 효율성을 지원하고자 구글은 통신 소프트웨어 개발사 암독스와 제휴하여 구글 클라우드 상에서 데이터 분석, SRE(Site Reliability Engineering), 5G 엣지 솔루션을 제공한다. 또한 넷크래커 테크놀로지(Netcracker Technology)와의 협력을 통해 전체 디지털 비즈니스 지원 시스템, 운영 지원 시스템...

데이터 운영효율성 안토스 구글클라우드 엣지컴퓨팅 쿠버네티스 데이터분석 머신러닝 오케스트레이션 통신사 인사이트 빅쿼리 5G 인공지능 AT&T 빅데이터 구글 5G수익화

2020.03.09

구글 클라우드가 5G 수익화, 운영 효율성 향상, 데이터 기반 인사이트 제공을 골자로 하는 통신사 지원 전략을 발표했다.  구글 클라우드 CEO 토마스 쿠리안이 5일 자사 블로그를 통해 통신사 지원을 위한 3가지 전략 분야를 밝혔다. ▲비즈니스 서비스 플랫폼으로써 5G 수익 창출, ▲ 통신사 시스템 전반의 운영 효율성 개선, ▲데이터 중심 인사이트 제공이다.    5G 수익화 구글이 5G 수익 창출을 목적으로 선보인 것은 5G 솔루션을 포함하는 글로벌 모바일 엣지 클라우드(Global Mobile Edge Cloud, GMEC) 전략이다. 이 솔루션들은 전 세계적으로 배포될 계획이다.  일례로 구글은 미국 통신사 AT&T가 소매, 제조, 운송 업계에 5G 엣지 컴퓨팅 솔루션을 제공할 수 있도록 해당 통신사와 협력했다. AT&T 부사장이자 최고 마케팅 책임자(CMO) 모 카티베는 AT&T의 네트워크와 구글의 기술(AI, ML,쿠버네티스, 엣지 컴퓨팅)을 결합한 5G 솔루션을 선보일 것이라고 전했다.  이어서 그는 “차세대 클라우드 서비스를 제공하고자 구글 클라우드와 협력하고 있다”라며, “구글 클라우드의 엣지 컴퓨팅 기술과 5G를 결합하면, 클라우드의 잠재력이 발휘될 수 있다. 클라우드와 엣지 기술로 새로운 경험을 제공할 수 있는 단계에 가까워지고 있다”라고 덧붙였다.  또한 구글의 5G 수익화 계획에는 통신사에 클라우드 관리 플랫폼을 제공하는 안토스(Anthos) 솔루션의 새 버전도 포함돼 있다. 운영 효율성 향상  통신사의 운영 효율성을 지원하고자 구글은 통신 소프트웨어 개발사 암독스와 제휴하여 구글 클라우드 상에서 데이터 분석, SRE(Site Reliability Engineering), 5G 엣지 솔루션을 제공한다. 또한 넷크래커 테크놀로지(Netcracker Technology)와의 협력을 통해 전체 디지털 비즈니스 지원 시스템, 운영 지원 시스템...

2020.03.09

구글, ‘2020 클라우드 환경을 위한 가이드’ 공개

구글 클라우드가 새로운 한 해를 맞이하며 그런 고객들에게 보내는 조언을 공식 블로그를 통해 공개했다. 이제 클라우드는 기업 규모와 상관없이 비즈니스 인프라를 받쳐 주고 견인하는 중요한 요소로 자리 잡았다. 그런 클라우드를 좀 더 효율적이고 가치 있게 활용하기를 바라는 의미에서, 자신들의 다짐과 고객을 위한 메시지를 담았다고 구글은 밝혔다. 클라우드를 구성하고 활용하는 방법이나 사례는 수없이 다양하다. 기업마다 다르고, 같은 기업 내에서도 업무마다 다르다. 동일한 업종의 기업이라도, 전혀 다른 방법으로 클라우드 인프라를 운영하고 있을 수도 있다. 처음 선택한 구성대로 몇 년을 변함없이 사용하는 경우가 있는가 하면, 끊임없이 고민하고 연구하며 새로운 방향으로 진화시켜 가는 경우도 있다. 구글 클라우드는 그런 기업들이 좀 더 효율적으로 클라우드를 활용할 수 있는 6가지 방법을 다음과 같이 소개했다. 첫 번째는 불필요한 데이터를 골라내 삭제하는, ‘데이터 다이어트(Lose some data weight)’가 필요하다. 클라우드를 사용하는 사용자와 관리자 그리고 데이터 센터 운영자까지, ‘클라우드’ 생태계에 관련된 모든 사람이 눈여겨 보아야 할 항목이다. 클라우드가 가진 여러 가지 장점이 많이 있지만, 그중에 대표적인 것이 데이터 저장과 보관의 편리성을 꼽을 수 있다.  하지만 이러한 편리함에 안주하다 보면, 불필요한 데이터까지 쌓아두는, 비효율적인 운영 습관에 빠질 수 있다. 불필요한 데이터를 쌓아두는 시간과 용량이 커질수록, 저장 공간은 부족해지고 이는 곧 비용 증가로 이어진다. 반대로 꼭 필요한 데이터만 보관하면 비용을 절감하고 더욱 효율적으로 운영할 수 있다. 예를 들면 가상머신의 스냅샷이나 백업 파일 중에서 영구 폐기해도 상관없는 것들은 삭제하는 것이 좋다. 두 번째는 데이터를 쌓아만 두지 말고, ‘더 많이 활용(Exercise your data more)’하는 것이다. 예를 들면 온-프레미스 데이터웨어하우징 및 분석을 간편하게 할 수 있...

클라우드 구글 빅쿼리

2020.01.06

구글 클라우드가 새로운 한 해를 맞이하며 그런 고객들에게 보내는 조언을 공식 블로그를 통해 공개했다. 이제 클라우드는 기업 규모와 상관없이 비즈니스 인프라를 받쳐 주고 견인하는 중요한 요소로 자리 잡았다. 그런 클라우드를 좀 더 효율적이고 가치 있게 활용하기를 바라는 의미에서, 자신들의 다짐과 고객을 위한 메시지를 담았다고 구글은 밝혔다. 클라우드를 구성하고 활용하는 방법이나 사례는 수없이 다양하다. 기업마다 다르고, 같은 기업 내에서도 업무마다 다르다. 동일한 업종의 기업이라도, 전혀 다른 방법으로 클라우드 인프라를 운영하고 있을 수도 있다. 처음 선택한 구성대로 몇 년을 변함없이 사용하는 경우가 있는가 하면, 끊임없이 고민하고 연구하며 새로운 방향으로 진화시켜 가는 경우도 있다. 구글 클라우드는 그런 기업들이 좀 더 효율적으로 클라우드를 활용할 수 있는 6가지 방법을 다음과 같이 소개했다. 첫 번째는 불필요한 데이터를 골라내 삭제하는, ‘데이터 다이어트(Lose some data weight)’가 필요하다. 클라우드를 사용하는 사용자와 관리자 그리고 데이터 센터 운영자까지, ‘클라우드’ 생태계에 관련된 모든 사람이 눈여겨 보아야 할 항목이다. 클라우드가 가진 여러 가지 장점이 많이 있지만, 그중에 대표적인 것이 데이터 저장과 보관의 편리성을 꼽을 수 있다.  하지만 이러한 편리함에 안주하다 보면, 불필요한 데이터까지 쌓아두는, 비효율적인 운영 습관에 빠질 수 있다. 불필요한 데이터를 쌓아두는 시간과 용량이 커질수록, 저장 공간은 부족해지고 이는 곧 비용 증가로 이어진다. 반대로 꼭 필요한 데이터만 보관하면 비용을 절감하고 더욱 효율적으로 운영할 수 있다. 예를 들면 가상머신의 스냅샷이나 백업 파일 중에서 영구 폐기해도 상관없는 것들은 삭제하는 것이 좋다. 두 번째는 데이터를 쌓아만 두지 말고, ‘더 많이 활용(Exercise your data more)’하는 것이다. 예를 들면 온-프레미스 데이터웨어하우징 및 분석을 간편하게 할 수 있...

2020.01.06

"알고리즘으로 씨름하지 마세요"··· SaaS 방식 머신러닝 API 10선

그리 오래지 않은 과거만 해도 인공 지능이라고 하면 흰색 실험실 가운을 입은 사람들의 전유물이었다. 과학이란 신비롭고 복잡하며 극소수의 사람만 이해할 수 있는 학문이었다. 이제는 아니다. 실험실 가운을 입은 과학자들은 소프트웨어를 서비스로 배포하는 방식이 지닌 위력을 알아채고는 코드를 모아 누구나 사용할 수 있는 API로 만들었다. 서비스에 데이터를 게시하면 똑똑한 인공 지능이 몇 ms만에 결과를 가지고 온다. 물론 데이터 집합이 큰 경우 그보다 조금 더 오래 걸릴 수는 있다. 인공 지능은 데이터를 가지고 가서 도대체 무슨 일을 하는 걸까? 그 부분에는 별로 신경 쓸 필요 없다. 신경 쓰지 않아도 되는 것이 바로 SaaS(software as a service)의 핵심이다. 그저 데이터가 들어가면 똘똘하게 결과를 내보낼 뿐이다. 물론 이 말은 약간 과장이다. AI 코드 깊은 부분의 수학까지 속속들이 이해할 필요는 없고 “이것을 텐서(tensor)하고 저것을 벡터(vector)하고” 따위의 말을 능숙하게 구사할 정도의 지식이 필요하지도 않지만, 데이터가 잘 들어갈 때까지 어느 정도 시간을 들여 작업해야 한다. 적절한 줄에 올바른 유형의 값을 집어넣은 적절한 형식의 데이터를 완성하기까지는 여전히 상당한 작업이 필요하다. 데이터를 만족스럽게 가공한 이후에는 거의 대부분 API를 여러 번 반복해서 실행하게 된다. 이것이 이 모델의 핵심의 일부분이다. 시간을 들여 문제의 형태를 가다듬은 다음 API가 AI 코드를 실행하도록 하면 된다. 사람은 과학에 집중하고 API는 복잡한 수치 계산에 집중한다. 완벽하지는 않지만 직접 코드를 쓰는 것보다는 낫다. 그런 이유로 AI는 폭발적인 관심을 끌고, 선택할 수 있는 머신러닝 API가 많이 나오고 데이터를 모델로, 모델을 웹 서비스로 바꿔주는 클라우드 서비스가 있는 것이다. 복잡한 알고리즘을 붙잡고 씨름하는 몇 시간, 며칠, 몇 달의 시간을 아껴줄 머신러...

구글 마이크로소프트 AWS 번역 인공지능 API 얼굴인식 빅쿼리

2018.09.13

그리 오래지 않은 과거만 해도 인공 지능이라고 하면 흰색 실험실 가운을 입은 사람들의 전유물이었다. 과학이란 신비롭고 복잡하며 극소수의 사람만 이해할 수 있는 학문이었다. 이제는 아니다. 실험실 가운을 입은 과학자들은 소프트웨어를 서비스로 배포하는 방식이 지닌 위력을 알아채고는 코드를 모아 누구나 사용할 수 있는 API로 만들었다. 서비스에 데이터를 게시하면 똑똑한 인공 지능이 몇 ms만에 결과를 가지고 온다. 물론 데이터 집합이 큰 경우 그보다 조금 더 오래 걸릴 수는 있다. 인공 지능은 데이터를 가지고 가서 도대체 무슨 일을 하는 걸까? 그 부분에는 별로 신경 쓸 필요 없다. 신경 쓰지 않아도 되는 것이 바로 SaaS(software as a service)의 핵심이다. 그저 데이터가 들어가면 똘똘하게 결과를 내보낼 뿐이다. 물론 이 말은 약간 과장이다. AI 코드 깊은 부분의 수학까지 속속들이 이해할 필요는 없고 “이것을 텐서(tensor)하고 저것을 벡터(vector)하고” 따위의 말을 능숙하게 구사할 정도의 지식이 필요하지도 않지만, 데이터가 잘 들어갈 때까지 어느 정도 시간을 들여 작업해야 한다. 적절한 줄에 올바른 유형의 값을 집어넣은 적절한 형식의 데이터를 완성하기까지는 여전히 상당한 작업이 필요하다. 데이터를 만족스럽게 가공한 이후에는 거의 대부분 API를 여러 번 반복해서 실행하게 된다. 이것이 이 모델의 핵심의 일부분이다. 시간을 들여 문제의 형태를 가다듬은 다음 API가 AI 코드를 실행하도록 하면 된다. 사람은 과학에 집중하고 API는 복잡한 수치 계산에 집중한다. 완벽하지는 않지만 직접 코드를 쓰는 것보다는 낫다. 그런 이유로 AI는 폭발적인 관심을 끌고, 선택할 수 있는 머신러닝 API가 많이 나오고 데이터를 모델로, 모델을 웹 서비스로 바꿔주는 클라우드 서비스가 있는 것이다. 복잡한 알고리즘을 붙잡고 씨름하는 몇 시간, 며칠, 몇 달의 시간을 아껴줄 머신러...

2018.09.13

칼럼 | 막 오른 클라우드 DBMS 전쟁, 승자는 누가 될까?

클라우드 시장의 제2라운드가 DBMS에서 시작됐다. 최근 아마존 웹 서비스(AWS)가 다양한 클라우드 DBMS로 시장을 공략하기 시작했고, 이에 질세라 마이크로소프트도 응수하고 있다. 마이크로소프트 코스모스DB의 올인원 접근 방식은 AWS 다이나모DB, 레드시프트, 오로라 같은 특정 툴이 아니라 개발자가 실제로 원하는 것이어서 코스모스DB의 선전이 기대된다. 최근 클라우드 데이터베이스 시장에 변화가 있었다. 좀 더 구체적으로 비긴(Begin)의 설립자 브라이언 레록스가 먼저 인지했듯이 마이크로소프트 애저 코스모스DB(Microsoft Azure Cosmos DB)가 AWS 레드시프트(Redshift)를 추월했다. AWS 데이터베이스 선두자인 다이나모DB(DynamoDB)는 2017년 현상유지에 그쳤다. 하지만 DB 엔진스(DB Engines)의 전체 순위에 따르면, 코스모스DB는 58위에서 27계단이나 올라선 31위를 기록했다. 여러 클라우드 경쟁사의 데이터 접근방식이 크게 달라졌다. AWS는 데이터 웨어하우징(Warehousing)을 위한 아마존 레드시프트(Amazon Redshift), 전통적인 관계형 작업 부하를 위한 아마존 오로라/RDS(Amazon Aurora/RDS), NoSQL을 위한 AWS 다이나모DB 등 익숙한 데이터 필요에 대한 강력한 옵션을 도입했다. 한편, 마이크로소프트는 코스모스DB를 통해 긴급한 것으로 보이는 데이터에 대해 만병통치약 접근방식을 택함으로써 AWS와 정반대로 가고 있다. 새로운 국면으로 접어든 클라우드 데이터베이스 대부분 데이터는 오라클, MySQL, 마이크로소프트 SQL 서버(SQL Server) 등의 전통적인 RDBMS에서 확실히 개선되고 있다. NoSQL로 이것이 바뀌기 시작했지만(유연한 개요 문서 데이터 저장이 가능한 몽고DB(MongoDB)가 가장 좋은 예다.) 데이터베이스는 여전히 변화 가능성이 가장 낮은 기업 인프라다. 또한 데이터베이스를 변경할 때 그에 따르는 위험이 너무 ...

구글 Polyglot Persistence 다중 언어 일관성 코스모스DB 애저 SQL 다이나모DB 그래프 데이터베이스 레드시프트 몽고DB 빅쿼리 어도비 AWS DBMS 마이크로소프트 아마존 오라클 프로그레스SQL

2018.01.10

클라우드 시장의 제2라운드가 DBMS에서 시작됐다. 최근 아마존 웹 서비스(AWS)가 다양한 클라우드 DBMS로 시장을 공략하기 시작했고, 이에 질세라 마이크로소프트도 응수하고 있다. 마이크로소프트 코스모스DB의 올인원 접근 방식은 AWS 다이나모DB, 레드시프트, 오로라 같은 특정 툴이 아니라 개발자가 실제로 원하는 것이어서 코스모스DB의 선전이 기대된다. 최근 클라우드 데이터베이스 시장에 변화가 있었다. 좀 더 구체적으로 비긴(Begin)의 설립자 브라이언 레록스가 먼저 인지했듯이 마이크로소프트 애저 코스모스DB(Microsoft Azure Cosmos DB)가 AWS 레드시프트(Redshift)를 추월했다. AWS 데이터베이스 선두자인 다이나모DB(DynamoDB)는 2017년 현상유지에 그쳤다. 하지만 DB 엔진스(DB Engines)의 전체 순위에 따르면, 코스모스DB는 58위에서 27계단이나 올라선 31위를 기록했다. 여러 클라우드 경쟁사의 데이터 접근방식이 크게 달라졌다. AWS는 데이터 웨어하우징(Warehousing)을 위한 아마존 레드시프트(Amazon Redshift), 전통적인 관계형 작업 부하를 위한 아마존 오로라/RDS(Amazon Aurora/RDS), NoSQL을 위한 AWS 다이나모DB 등 익숙한 데이터 필요에 대한 강력한 옵션을 도입했다. 한편, 마이크로소프트는 코스모스DB를 통해 긴급한 것으로 보이는 데이터에 대해 만병통치약 접근방식을 택함으로써 AWS와 정반대로 가고 있다. 새로운 국면으로 접어든 클라우드 데이터베이스 대부분 데이터는 오라클, MySQL, 마이크로소프트 SQL 서버(SQL Server) 등의 전통적인 RDBMS에서 확실히 개선되고 있다. NoSQL로 이것이 바뀌기 시작했지만(유연한 개요 문서 데이터 저장이 가능한 몽고DB(MongoDB)가 가장 좋은 예다.) 데이터베이스는 여전히 변화 가능성이 가장 낮은 기업 인프라다. 또한 데이터베이스를 변경할 때 그에 따르는 위험이 너무 ...

2018.01.10

칼럼 | 구글 클라우드의 비밀병기 '구글처럼'

구글 클라우드의 가장 큰 강점은 ‘구글처럼’ 되고 싶어하는 기업의 기대를 충족할 수 있다는 것이다. 디지털 시대의 신생기업들이 구글 클라우드 위에서 구글 같은 혁신으로 승승장구하고 있다. 디지털 변혁의 의지가 있는, ‘구글이 되고픈 기업’에게 그 길을 안내할 유일한 대안은 구글밖에 없다.  2017년은 구글 클라우드 플랫폼(Google Cloud Platform)에게 괜찮은 한 해였다. 하지만 2018년은 더 좋을 것으로 예상된다. 구글은 아직 아마존 웹 서비스(AWS)와 마이크로소프트 애저보다 클라우드 매출액이 크게 뒤처져 있다. 가트너 자료에 따르면 시장 점유율이 AWS와 애저는 각각 44.1%와 7.1%인데 반해 구글은 2.3%에 불과했다. 그런데도 2018년은 구글이 뜨는 해가 될 수 있다. 구글이 뜨는 해가 되기 위한 조건은 단 하나, 기업들이 좀더 구글처럼 운영되도록 도움을 줄 수 있어야 한다. 과거에 이런 일은 비현실적으로 느껴졌었다. 구글은 하루에 수천 가지의 변화를 시스템에 적용하는 일이 일상이지만 대다수 기업에는 애초에 그렇게 할 수 있는 DNA가 없기 때문이다. 그러나 초기 지표를 보면 이제는 그렇지 않으며 일반적인 기업들도 ‘구글처럼 운영’한다는 목표를 달성할 수 있을 것으로 보인다. 그렇다면 구글 클라우드가 본격적으로 기업에 도입될 것이다. 다른 기업들도 ‘구글처럼 운영’ 가능성 농후 물론 현재 AWS가 압도적인 1위이지만 그 이유의 대부분은 구식 인프라 업체와 현재 클라우드 경쟁자보다 7년 먼저 시작했기 때문이다. 구형 인프라 업체는 사실 망했지만(물론 기업이 ‘망’하는 데 수십 년이 걸리기도 한다) 마이크로소프트와 구글과 같은 클라우드 경쟁자에게 게임은 이제 시작이다! 마이크로소프트는 차세대 AI 스마트 기능을 도입하고 기존 고객들과의 신뢰 관계를 활용함으로써(마이크로소프트와 거래를 많이 하는 CIO들은 자...

CIO 텐서플로 쿠버네티스 구글 클라우드 플랫폼 스냅 구글 클라우드 머신러닝 데이터플로우 데이터프록 퍼브/서브 Pub/Sub 에어버스 마이크로소프트 애저 퍼블릭 클라우드 가트너 AWS 하둡 필립스 스포티파이 인공지능 하이브 빅쿼리 아마존 웹 서비스 구글처럼

2017.12.26

구글 클라우드의 가장 큰 강점은 ‘구글처럼’ 되고 싶어하는 기업의 기대를 충족할 수 있다는 것이다. 디지털 시대의 신생기업들이 구글 클라우드 위에서 구글 같은 혁신으로 승승장구하고 있다. 디지털 변혁의 의지가 있는, ‘구글이 되고픈 기업’에게 그 길을 안내할 유일한 대안은 구글밖에 없다.  2017년은 구글 클라우드 플랫폼(Google Cloud Platform)에게 괜찮은 한 해였다. 하지만 2018년은 더 좋을 것으로 예상된다. 구글은 아직 아마존 웹 서비스(AWS)와 마이크로소프트 애저보다 클라우드 매출액이 크게 뒤처져 있다. 가트너 자료에 따르면 시장 점유율이 AWS와 애저는 각각 44.1%와 7.1%인데 반해 구글은 2.3%에 불과했다. 그런데도 2018년은 구글이 뜨는 해가 될 수 있다. 구글이 뜨는 해가 되기 위한 조건은 단 하나, 기업들이 좀더 구글처럼 운영되도록 도움을 줄 수 있어야 한다. 과거에 이런 일은 비현실적으로 느껴졌었다. 구글은 하루에 수천 가지의 변화를 시스템에 적용하는 일이 일상이지만 대다수 기업에는 애초에 그렇게 할 수 있는 DNA가 없기 때문이다. 그러나 초기 지표를 보면 이제는 그렇지 않으며 일반적인 기업들도 ‘구글처럼 운영’한다는 목표를 달성할 수 있을 것으로 보인다. 그렇다면 구글 클라우드가 본격적으로 기업에 도입될 것이다. 다른 기업들도 ‘구글처럼 운영’ 가능성 농후 물론 현재 AWS가 압도적인 1위이지만 그 이유의 대부분은 구식 인프라 업체와 현재 클라우드 경쟁자보다 7년 먼저 시작했기 때문이다. 구형 인프라 업체는 사실 망했지만(물론 기업이 ‘망’하는 데 수십 년이 걸리기도 한다) 마이크로소프트와 구글과 같은 클라우드 경쟁자에게 게임은 이제 시작이다! 마이크로소프트는 차세대 AI 스마트 기능을 도입하고 기존 고객들과의 신뢰 관계를 활용함으로써(마이크로소프트와 거래를 많이 하는 CIO들은 자...

2017.12.26

구글 빅쿼리, 하둡 SQL 최대 약점 '동시 실행' 대안 될까

빅데이터에서 BI(Business Intelligence) 작업을 처리하는 과정에서 다수의 동시 쿼리(Query) 기능이 중요한 기업이라면 구글 빅쿼리(Google BigQuery)를 테스트해 보는 것이 좋은 대안이다. 빅데이터내 BI를 지원하는 스타트업 '앳스케일(AtScale)'이 지난 6일 공개한 새로운 벤치마크 결과를 보면 빅쿼리의 최대 강점은 동시 실행인 것으로 나타났다. 소규모 데이터 세트에서의 동시 쿼리에서 성능 저하가 없었고 25명 이상의 동시 BI 사용자를 설정한 쿼리에서도 마찬가지였다. 앳스케일의 제품관리 부사장 조시 클레어에 따르면, 그동안 하둡 SQL(SQL-on-Hadoop)의 아킬레스건은 단연 '동시 실행'이었다. 그는 "그러나 빅쿼리는 달랐다. 성능 뿐만 아니라 사용자 경험도 훌륭했다. 구글이 수 년동안 소비자용 제품에 크게 집중했다는 점을 고려하면 놀랄 일이 아닐 수도 있지만 기대 이상이었다. 실제 작업에서는 우리의 로컬 네트워크에서 클라우드로 데이터를 로딩하는 데 가장 많은 시간이 걸렸다. 일단 데이터가 있으면 테이블 작성이 정말 쉬웠다”라고 말했다. 구체적인 벤치마크 과정은 지난 해 BI 작업 부하에 대한 하둡 SQL 엔진 벤치마크 테스트와 같은 모델을 사용했다. 이 테스트는 IT 전문가가 자신의 BI 활용 사례에 맞춰 가장 좋은 하둡 SQL 기술을 선택할 수 있도록 돕기 위한 것이다. 구글 빅쿼리 벤치마크도 같은 목적으로 진행됐다. CR(Constellation Research)의 부사장겸 수석 애널리스트인 헨쉔은 “앳스케일 벤치마크는 기업 리더가 빅데이터에 BI를 활용하는 데 필요한 유용한 비교를 제공한다. 데이터가 더 복잡하고 다양해지면서 이런 벤치마크 통계가 기업이 주요 빅데이터 쿼리 선택사항을 파악하고 BI 인프라 지원에 필수적인 더 나은 결정을 내리는 데 도움이 된다"라고 말했다. 앳스케일 테스트팀은 널리 사용하는 T...

CIO 구글 하둡 SQL 빅쿼리

2017.04.11

빅데이터에서 BI(Business Intelligence) 작업을 처리하는 과정에서 다수의 동시 쿼리(Query) 기능이 중요한 기업이라면 구글 빅쿼리(Google BigQuery)를 테스트해 보는 것이 좋은 대안이다. 빅데이터내 BI를 지원하는 스타트업 '앳스케일(AtScale)'이 지난 6일 공개한 새로운 벤치마크 결과를 보면 빅쿼리의 최대 강점은 동시 실행인 것으로 나타났다. 소규모 데이터 세트에서의 동시 쿼리에서 성능 저하가 없었고 25명 이상의 동시 BI 사용자를 설정한 쿼리에서도 마찬가지였다. 앳스케일의 제품관리 부사장 조시 클레어에 따르면, 그동안 하둡 SQL(SQL-on-Hadoop)의 아킬레스건은 단연 '동시 실행'이었다. 그는 "그러나 빅쿼리는 달랐다. 성능 뿐만 아니라 사용자 경험도 훌륭했다. 구글이 수 년동안 소비자용 제품에 크게 집중했다는 점을 고려하면 놀랄 일이 아닐 수도 있지만 기대 이상이었다. 실제 작업에서는 우리의 로컬 네트워크에서 클라우드로 데이터를 로딩하는 데 가장 많은 시간이 걸렸다. 일단 데이터가 있으면 테이블 작성이 정말 쉬웠다”라고 말했다. 구체적인 벤치마크 과정은 지난 해 BI 작업 부하에 대한 하둡 SQL 엔진 벤치마크 테스트와 같은 모델을 사용했다. 이 테스트는 IT 전문가가 자신의 BI 활용 사례에 맞춰 가장 좋은 하둡 SQL 기술을 선택할 수 있도록 돕기 위한 것이다. 구글 빅쿼리 벤치마크도 같은 목적으로 진행됐다. CR(Constellation Research)의 부사장겸 수석 애널리스트인 헨쉔은 “앳스케일 벤치마크는 기업 리더가 빅데이터에 BI를 활용하는 데 필요한 유용한 비교를 제공한다. 데이터가 더 복잡하고 다양해지면서 이런 벤치마크 통계가 기업이 주요 빅데이터 쿼리 선택사항을 파악하고 BI 인프라 지원에 필수적인 더 나은 결정을 내리는 데 도움이 된다"라고 말했다. 앳스케일 테스트팀은 널리 사용하는 T...

2017.04.11

"구글 클라우드에 의료 정보 올리기, 데이터 보호법 위반" 英 단체 주장

영국 단체들은 의료 정보처럼 중요한 데이터 데이터를 영국 정부 관할을 벗어난 업체에 업로드해선 안된다고 당부했다. 영국의 개인정보 보호 단체들이 의료 기록을 처리하는데 구글의 클라우드 서비스를 사용하는 것은 영국의 데이터 보호법을 심각하게 위반하는 것이라고 해당 정부의 데이터보호기관에 항의했다. 영국의 개인정보 보호 단체인 메드컨피덴셜(medConfidential), 빅 브라더 와치(Big Brother Watch), 정보 정책 연구 재단(Foundation for Information Policy Research)은 최근 컨설팅 기업인 PA컨설팅이 의료 데이터를 수집하고 이를 분석하고자 구글의 클라우드에 업로드했다고 밝혔으며 영국 정보 위원회 사무국(ICO)에 문제를 제기했다. 정보센터에 따르면, 2011년 영국의 보건 및 사회 복지 정보센터(HSCIC)의 전신이 병원 에피소드 통계(HES) 환자 데이터베이스를 PA 컨설팅과 공유할 수 있는 계약을 체결했다. 병원 에피소드 통계는 매년 1억 2,500명 이상의 환자들의 외래, 사고, 응급처치 기록을 처리하는 것으로 전해졌다. 각 HES 기록은 일반적으로 연령, 성별, 인종, 진단 및 치료 코드, 환자 치료, 생의 한 지점에 대한 자세한 내용 등 개별 환자에 대한 광범위한 정보가 포함돼 있다. 기본적으로 HES 데이터는 환자의 약 98%를 개인적으로 식별할만한 출생, 우편 번호, 날짜 등 환자 개인의 정보가 충분히 들어있다고 단체들은 말했다. 데이터는 필명으로 기록됐고 분석 프로젝트에서 쓰였다고 PA컨설팅은 성명서에 반박했다. 그러나, 방대한 환자 데이터의 수집물을 분석하기 위해 PA 컨설팅은 구글에 데이터를 업로드했고 구글의 분석 서비스인 빅쿼리(BigQuery)를 통해 처리했다. 클라우드 서비스인 빅쿼리는 대규모 데이터 세트의 상호분석을 가능하게 해준다. 개인정보 보호 단체들은 일어나지 말아야 할 일이 일어날 수도 있다고 주장했다. "어떤 엄격한 규제를 ...

구글 구글 클라우드 분석 환자 정보 의료 정보 빅쿼리 병원 영국 개인정보 보호 빅데이터 ICO

2014.03.18

영국 단체들은 의료 정보처럼 중요한 데이터 데이터를 영국 정부 관할을 벗어난 업체에 업로드해선 안된다고 당부했다. 영국의 개인정보 보호 단체들이 의료 기록을 처리하는데 구글의 클라우드 서비스를 사용하는 것은 영국의 데이터 보호법을 심각하게 위반하는 것이라고 해당 정부의 데이터보호기관에 항의했다. 영국의 개인정보 보호 단체인 메드컨피덴셜(medConfidential), 빅 브라더 와치(Big Brother Watch), 정보 정책 연구 재단(Foundation for Information Policy Research)은 최근 컨설팅 기업인 PA컨설팅이 의료 데이터를 수집하고 이를 분석하고자 구글의 클라우드에 업로드했다고 밝혔으며 영국 정보 위원회 사무국(ICO)에 문제를 제기했다. 정보센터에 따르면, 2011년 영국의 보건 및 사회 복지 정보센터(HSCIC)의 전신이 병원 에피소드 통계(HES) 환자 데이터베이스를 PA 컨설팅과 공유할 수 있는 계약을 체결했다. 병원 에피소드 통계는 매년 1억 2,500명 이상의 환자들의 외래, 사고, 응급처치 기록을 처리하는 것으로 전해졌다. 각 HES 기록은 일반적으로 연령, 성별, 인종, 진단 및 치료 코드, 환자 치료, 생의 한 지점에 대한 자세한 내용 등 개별 환자에 대한 광범위한 정보가 포함돼 있다. 기본적으로 HES 데이터는 환자의 약 98%를 개인적으로 식별할만한 출생, 우편 번호, 날짜 등 환자 개인의 정보가 충분히 들어있다고 단체들은 말했다. 데이터는 필명으로 기록됐고 분석 프로젝트에서 쓰였다고 PA컨설팅은 성명서에 반박했다. 그러나, 방대한 환자 데이터의 수집물을 분석하기 위해 PA 컨설팅은 구글에 데이터를 업로드했고 구글의 분석 서비스인 빅쿼리(BigQuery)를 통해 처리했다. 클라우드 서비스인 빅쿼리는 대규모 데이터 세트의 상호분석을 가능하게 해준다. 개인정보 보호 단체들은 일어나지 말아야 할 일이 일어날 수도 있다고 주장했다. "어떤 엄격한 규제를 ...

2014.03.18

'하둡 사용자 유혹하는' 구글의 빅쿼리 업데이트

구글 빅쿼리(BigQuery)가 다중 데이터 테이블를 쿼리할 수 있게 됐다. 다분히 아파치 하둡 이용자를 겨냥한 행보로 풀이된다. 구글 빅쿼리 프로덕트 매니저 주카이 퀙은 블로그 포스트를 통해 이번 업데이트에 대해 다음과 같이 언급했다. "테라바이트 크기의 태이블을 연결시키는 작업은 데이터 애널리스트들에게 그야말로 어려운 작업이었다. 복잡한 맵리듀스 개발 스킬이나 강력한 하드웨어, 방대한 시간이 요구되곤 햇다. 이들 3가지가 한꺼번에 요구되는 경우도 있었다. 이제 빅쿼리를 통해 기업은 SQL과 같은 쿼리를 이용해 인사이트를 전달할 수 있게 됐다. 훨씬 적은 자원만으로, 더 빠른 시간에 가능하다." 구글 측은 이어 하둡 대신 빅쿼리를 이용함으로써 비용을 절감할 수 있다고 주장했다. 개별 하둡 지원 콤포넌트를 구동하기 위한 연산 비용을 지불하는 대신, 처리되는 쿼리에 대해서만 비용을 지불하면 된다는 이유에서다. 2010년 출범한 빅쿼리에 대해 구글은 대용량 데이터를 처리할 수 있는 쌍방향 서비스라고 홍보하고 있다. 이용자가 데이터 세트를 구글에 업로드하고 빅쿼리 API를 이용해 이에 대한 쿼리를 던지는 방식으로 이용할 수 있다. 이번 업데이트는 빅쿼리의 능력을 확대하는 것으로, 특히 새로운 조인(JOIN) 항목은 다중 데이터 소스를 가로질러 쿼리 결과를 조합할 수 있게 해준다. 기존 빅쿼리의 조인 항목은 8MB 이하의 데이터 세트에 대해서만 이용할 수 있었지만, 새로운 조인 이치(JOIN EACH) 항목에서는 데이터 용량 제한이 없어졌다. 이는 빅쿼리가 하둡의 맵리듀스 대체품으로 활용될 가능성을 시사한다. 현재 많은 하둡 업무는 2개 이상의 데이터 세트에서 비롯된 대용량 데이터를 조합해 이뤄지곤 한다. 개발자는 이를 위해 맵리듀스 프로세스를 처음부터 작성해야 하는데, 이는 많은 시간과 자원을 요구하곤 했다. 반면 조인 이치는 공통 키를 공유하는 2개의 대용량 데이터베이스 테이블로부터 단일 결과를 산출할 수 있다. ...

구글 업데이트 하둡 빅 데이터 빅쿼리

2013.03.15

구글 빅쿼리(BigQuery)가 다중 데이터 테이블를 쿼리할 수 있게 됐다. 다분히 아파치 하둡 이용자를 겨냥한 행보로 풀이된다. 구글 빅쿼리 프로덕트 매니저 주카이 퀙은 블로그 포스트를 통해 이번 업데이트에 대해 다음과 같이 언급했다. "테라바이트 크기의 태이블을 연결시키는 작업은 데이터 애널리스트들에게 그야말로 어려운 작업이었다. 복잡한 맵리듀스 개발 스킬이나 강력한 하드웨어, 방대한 시간이 요구되곤 햇다. 이들 3가지가 한꺼번에 요구되는 경우도 있었다. 이제 빅쿼리를 통해 기업은 SQL과 같은 쿼리를 이용해 인사이트를 전달할 수 있게 됐다. 훨씬 적은 자원만으로, 더 빠른 시간에 가능하다." 구글 측은 이어 하둡 대신 빅쿼리를 이용함으로써 비용을 절감할 수 있다고 주장했다. 개별 하둡 지원 콤포넌트를 구동하기 위한 연산 비용을 지불하는 대신, 처리되는 쿼리에 대해서만 비용을 지불하면 된다는 이유에서다. 2010년 출범한 빅쿼리에 대해 구글은 대용량 데이터를 처리할 수 있는 쌍방향 서비스라고 홍보하고 있다. 이용자가 데이터 세트를 구글에 업로드하고 빅쿼리 API를 이용해 이에 대한 쿼리를 던지는 방식으로 이용할 수 있다. 이번 업데이트는 빅쿼리의 능력을 확대하는 것으로, 특히 새로운 조인(JOIN) 항목은 다중 데이터 소스를 가로질러 쿼리 결과를 조합할 수 있게 해준다. 기존 빅쿼리의 조인 항목은 8MB 이하의 데이터 세트에 대해서만 이용할 수 있었지만, 새로운 조인 이치(JOIN EACH) 항목에서는 데이터 용량 제한이 없어졌다. 이는 빅쿼리가 하둡의 맵리듀스 대체품으로 활용될 가능성을 시사한다. 현재 많은 하둡 업무는 2개 이상의 데이터 세트에서 비롯된 대용량 데이터를 조합해 이뤄지곤 한다. 개발자는 이를 위해 맵리듀스 프로세스를 처음부터 작성해야 하는데, 이는 많은 시간과 자원을 요구하곤 했다. 반면 조인 이치는 공통 키를 공유하는 2개의 대용량 데이터베이스 테이블로부터 단일 결과를 산출할 수 있다. ...

2013.03.15

빅 데이터를 위한 하둡, 그 이상의 방법은 없는가

하둡과 맵리듀스(MapReduce)는 오랫동안 빅 데이터의 중심이었지만, 일부 기업들은 이제 거대하고 지속적으로 성장해가는 데이터세트에서 비즈니스 가치를 뽑아내는 새롭고 더 빠른 방법을 찾고 있다.    많은 대형 조직들이 여전히 오픈소스 하둡 빅 데이터 프레임워크로 돌아서고 있지만, 이를 창시한 구글과 다른 이들은 이미 좀더 새로운 기술로 움직이고 있다.   아파치 하둡 플랫폼은 구글 파일 시스템과 구글 맵리듀스 기술의 오픈소스 버전이다. 이는 거대 검색엔진업체가 상용 하드웨어 상의 막대한 볼륨의 데이터를 관리하기 위한 목적으로 개발된 것이다.   아파치 하둡은 구글이 웹을 훑고 검색하는데 사용된 처리 기술의 핵심이었다. 지난 3년동안 수백 개의 기업들이 빠르게 성장하는 구조적 데이터, 반-구조적 데이터, 비구조적 데이터를 관리하기 위해 하둡을 채택했다.   오픈소스 기술은 로그나 이벤트 데이터 분석, 보안 이벤트 관리, 소셜 미디어 분석, 그리고 페타바이트급 데이터 세트를 포함하는 애플리케이션 등에서, 전통적인 기업 데이터웨어하우징 기술보다 더 값싼 옵션임이 증명됐다. 하둡 설계의 한계가 새로운 빅 데이터 기술 요구 애널리스트들은 일부 기업들이 기술의 제한때문이 아니라, 설계된 목적때문에, 하둡 이후를 생각하기 시작했다고 주장했다.   하둡은 데이터가 배치로 수집되고 처리되는 경우에 배치-프로세싱(batch-processing) 작업을 맡기 위해 만들어졌다. 하둡 환경에서의 데이터는 쪼개져서 고도로 분산된 상품 서버나 노드에 저장된다.   데이터로부터 보고서를 받기 위해서는, 사용자는 우선 업무를 쓰고, 제출한 후, 모든 노드에 분산되고 처리될 때까지 기다려야 한다.   데이터베이스와 분석 전문가인 커트 모내시는 "하둡 플랫폼이 잘 작동하고 있지만, 몇몇 핵심...

구글 맵리듀스 하둡 빅쿼리 드레멜 메타마켓 스트림리듀스 임팔라

2012.11.02

하둡과 맵리듀스(MapReduce)는 오랫동안 빅 데이터의 중심이었지만, 일부 기업들은 이제 거대하고 지속적으로 성장해가는 데이터세트에서 비즈니스 가치를 뽑아내는 새롭고 더 빠른 방법을 찾고 있다.    많은 대형 조직들이 여전히 오픈소스 하둡 빅 데이터 프레임워크로 돌아서고 있지만, 이를 창시한 구글과 다른 이들은 이미 좀더 새로운 기술로 움직이고 있다.   아파치 하둡 플랫폼은 구글 파일 시스템과 구글 맵리듀스 기술의 오픈소스 버전이다. 이는 거대 검색엔진업체가 상용 하드웨어 상의 막대한 볼륨의 데이터를 관리하기 위한 목적으로 개발된 것이다.   아파치 하둡은 구글이 웹을 훑고 검색하는데 사용된 처리 기술의 핵심이었다. 지난 3년동안 수백 개의 기업들이 빠르게 성장하는 구조적 데이터, 반-구조적 데이터, 비구조적 데이터를 관리하기 위해 하둡을 채택했다.   오픈소스 기술은 로그나 이벤트 데이터 분석, 보안 이벤트 관리, 소셜 미디어 분석, 그리고 페타바이트급 데이터 세트를 포함하는 애플리케이션 등에서, 전통적인 기업 데이터웨어하우징 기술보다 더 값싼 옵션임이 증명됐다. 하둡 설계의 한계가 새로운 빅 데이터 기술 요구 애널리스트들은 일부 기업들이 기술의 제한때문이 아니라, 설계된 목적때문에, 하둡 이후를 생각하기 시작했다고 주장했다.   하둡은 데이터가 배치로 수집되고 처리되는 경우에 배치-프로세싱(batch-processing) 작업을 맡기 위해 만들어졌다. 하둡 환경에서의 데이터는 쪼개져서 고도로 분산된 상품 서버나 노드에 저장된다.   데이터로부터 보고서를 받기 위해서는, 사용자는 우선 업무를 쓰고, 제출한 후, 모든 노드에 분산되고 처리될 때까지 기다려야 한다.   데이터베이스와 분석 전문가인 커트 모내시는 "하둡 플랫폼이 잘 작동하고 있지만, 몇몇 핵심...

2012.11.02

야후, 온라인 광고를 위한 빅 데이터 분석 툴 발표

야후가 온라인 광고주를 위한 빅 데이터 분석 툴을 발표했다. 게놈(Genome)이란 이름의 이 툴은 기업이 좀 더 타깃된 온라인 광고와 마케팅 캠페인을 전달할 수 있도록 하는 데 중점을 두고 있다.   게놈은 오는 7월부터 정식 상용화될 예정이며, 온라인 광고주들이 인터클릭은 물론 야후의 네트워크를 통해 모은 방대한 규모의 사용자 행동 및 광고 관련 데이터를 걸러내고 분석할 수 있도록 해 준다.   또한 광고주가 자사의 데이터를 가져와 야후의 데이터와 조합해 분석할 수도 있다.   야후는 “게놈은 지난해 마이크로소프트, AOL과 디스플레이 광고 협약을 맺고, 인터클릭을 인수한 전략의 결정체”라고 강조했다. 또한 게놈이 “광고주가 자사의 브랜드 가치를 구축하고 전환율을 높이고 매출을 성장시키는 등의 성과를 거두면서 데이터 생태계의 혼란을 관리할 수 있도록 해 줄 것”이라고 밝혔다.   야후의 이번 발표는 구글의 빅쿼리(BigQuery)에 대한 대응으로 보인다. 구글의 빅쿼리 서비스는 기업이 대규모 데이터를 구글의 클라우드 인프라에 업로드해 분석할 수 있도록 해 준다. 차이점은 구글의 빅쿼리는 기업들이 자사 데이터를 분석하는데 구글 인프라를 사용할 수 있도록 해준다는 점. 게놈은 마케터를 대상으로 하고 있으며, 기업들이 자사 데이터는 물론 야후의 데이터 세트를 사용할 수 있다는 것이 강점이다.   게놈과 빅쿼리 모두 날로 증가하는 빅 데이터 분석에 대한 수요에 대응하는 것으로 평가되고 있다. 지난 2년 동안 수많은 신생업체들이 이들 빅 데이터용 BI, 데이터 분석, 예측 분석 툴을 출시했으며, 적지 않은 기업이 이미 이들 툴을 도입해 사용하고 있다. 게놈과 빅쿼리는 기업들이 이런 빅 데이터 분석을 위해 자체 인프라에 투자하지 않고도 빅 데이터를 처리할 수 있다는 점에서 의미가 크다.  editor@...

구글 빅데이터 야후 분석 빅쿼리 게놈

2012.05.15

야후가 온라인 광고주를 위한 빅 데이터 분석 툴을 발표했다. 게놈(Genome)이란 이름의 이 툴은 기업이 좀 더 타깃된 온라인 광고와 마케팅 캠페인을 전달할 수 있도록 하는 데 중점을 두고 있다.   게놈은 오는 7월부터 정식 상용화될 예정이며, 온라인 광고주들이 인터클릭은 물론 야후의 네트워크를 통해 모은 방대한 규모의 사용자 행동 및 광고 관련 데이터를 걸러내고 분석할 수 있도록 해 준다.   또한 광고주가 자사의 데이터를 가져와 야후의 데이터와 조합해 분석할 수도 있다.   야후는 “게놈은 지난해 마이크로소프트, AOL과 디스플레이 광고 협약을 맺고, 인터클릭을 인수한 전략의 결정체”라고 강조했다. 또한 게놈이 “광고주가 자사의 브랜드 가치를 구축하고 전환율을 높이고 매출을 성장시키는 등의 성과를 거두면서 데이터 생태계의 혼란을 관리할 수 있도록 해 줄 것”이라고 밝혔다.   야후의 이번 발표는 구글의 빅쿼리(BigQuery)에 대한 대응으로 보인다. 구글의 빅쿼리 서비스는 기업이 대규모 데이터를 구글의 클라우드 인프라에 업로드해 분석할 수 있도록 해 준다. 차이점은 구글의 빅쿼리는 기업들이 자사 데이터를 분석하는데 구글 인프라를 사용할 수 있도록 해준다는 점. 게놈은 마케터를 대상으로 하고 있으며, 기업들이 자사 데이터는 물론 야후의 데이터 세트를 사용할 수 있다는 것이 강점이다.   게놈과 빅쿼리 모두 날로 증가하는 빅 데이터 분석에 대한 수요에 대응하는 것으로 평가되고 있다. 지난 2년 동안 수많은 신생업체들이 이들 빅 데이터용 BI, 데이터 분석, 예측 분석 툴을 출시했으며, 적지 않은 기업이 이미 이들 툴을 도입해 사용하고 있다. 게놈과 빅쿼리는 기업들이 이런 빅 데이터 분석을 위해 자체 인프라에 투자하지 않고도 빅 데이터를 처리할 수 있다는 점에서 의미가 크다.  editor@...

2012.05.15

클라우드 다음은 빅 데이터 분석?

타임워너 케이블의 클라우드 컴퓨팅과 매니지드 호스팅 업체인 내비사이트(NaviSite)가 자사의 클라우드 서비스를 다변화하는 노력의 일환으로 고객용 스토리지 서비스를 제공할 계획이라고 밝혔다. 한 애널리스트는 내비사이트의 계획에 대해 클라우드로 빅 데이터 분석을 제공하고자 하는 서비스의 시작이라고 분석했다. 최근에 개최된 행사인 인터롭(Interop)에서 내비사이트는 기업 고객들이 파일을 저장, 백업, 공유 할 수 있도록 EMC 아트모스(Atmos) 클라우드 아키텍처를 기반으로 하는 내비클라우드(NaviCloud) 인텔리전트 스토리지를 발표했다. 내비사이트는 전통적으로 애플리케이션 관리 서비스를 제공했다. 이 서비스는 최근 몇 년 동안 협업툴과 가상 데스크톱으로 확대되고 있다. 내비사이트 에서 클라우드 제공을 담당하는 제품 관리자 크리스 패터슨은 오브젝트 논리적인 순서대로 한다면, 기업이 앞으로 고려해야 할 스토리지(Object storage)라고 전했다. “오브젝트 스토리지는 우리가 이미 해온 것들의 연장선이다"라고 패터슨은 말했다. "우리는 훌륭한 클라우드 제공을 얻었지만, 그 위에 서비스를 보완하기 위해 새로운 것을 찾았다"라고 피터슨은 덧붙였다. 내비사이트는 기가바이트 당 20센트에서 시작하는 가격 모델을 제공하며 이 서비스는 6월 초면 가능할 것이다. IDC의 리서치 애널리스트인 리차드 빌라스는 내비사이트가 기업에 좀더 완벽한 패키지를 제공하기 위해 자사의 클라우드 서비스를 다지고 있다고 평가했다. 인프라 업체들은 향후 클라우드에 저장된 데이터를 분석하는 영역에서 지속적으로 성능을 향상시킬 것이라고 빌라스는 전망했다. "주요 하이엔드 클라우드 서비스 업체가 되고 싶어 하는 기업이라면, 빅 데이터 서비스가 몇 년 이내에 크게 부상할 예측할 것이다”라고 그는 밝혔다. 주요 서비스 업체가 되기 위해 해야 할 첫번째 단계는 오브젝트 스토리지 서비스를 확보하는 것이다. "좀...

인터롭 빅쿼리 내비사이트 타임워너 케이블

2012.05.11

타임워너 케이블의 클라우드 컴퓨팅과 매니지드 호스팅 업체인 내비사이트(NaviSite)가 자사의 클라우드 서비스를 다변화하는 노력의 일환으로 고객용 스토리지 서비스를 제공할 계획이라고 밝혔다. 한 애널리스트는 내비사이트의 계획에 대해 클라우드로 빅 데이터 분석을 제공하고자 하는 서비스의 시작이라고 분석했다. 최근에 개최된 행사인 인터롭(Interop)에서 내비사이트는 기업 고객들이 파일을 저장, 백업, 공유 할 수 있도록 EMC 아트모스(Atmos) 클라우드 아키텍처를 기반으로 하는 내비클라우드(NaviCloud) 인텔리전트 스토리지를 발표했다. 내비사이트는 전통적으로 애플리케이션 관리 서비스를 제공했다. 이 서비스는 최근 몇 년 동안 협업툴과 가상 데스크톱으로 확대되고 있다. 내비사이트 에서 클라우드 제공을 담당하는 제품 관리자 크리스 패터슨은 오브젝트 논리적인 순서대로 한다면, 기업이 앞으로 고려해야 할 스토리지(Object storage)라고 전했다. “오브젝트 스토리지는 우리가 이미 해온 것들의 연장선이다"라고 패터슨은 말했다. "우리는 훌륭한 클라우드 제공을 얻었지만, 그 위에 서비스를 보완하기 위해 새로운 것을 찾았다"라고 피터슨은 덧붙였다. 내비사이트는 기가바이트 당 20센트에서 시작하는 가격 모델을 제공하며 이 서비스는 6월 초면 가능할 것이다. IDC의 리서치 애널리스트인 리차드 빌라스는 내비사이트가 기업에 좀더 완벽한 패키지를 제공하기 위해 자사의 클라우드 서비스를 다지고 있다고 평가했다. 인프라 업체들은 향후 클라우드에 저장된 데이터를 분석하는 영역에서 지속적으로 성능을 향상시킬 것이라고 빌라스는 전망했다. "주요 하이엔드 클라우드 서비스 업체가 되고 싶어 하는 기업이라면, 빅 데이터 서비스가 몇 년 이내에 크게 부상할 예측할 것이다”라고 그는 밝혔다. 주요 서비스 업체가 되기 위해 해야 할 첫번째 단계는 오브젝트 스토리지 서비스를 확보하는 것이다. "좀...

2012.05.11

구글 빅 쿼리, 마침내 문호 개방

구글의 빅 쿼리(BigQuery)가 공식적으로 일반에게 공개됐다고 구글이 지난 1일 밝혔다. 빅 쿼리는 대용량 데이터 세트를 분석할 수 있도록 한 클라우드 기반의 서비스다. 구글에 따르면 빅 쿼리는 수 테라바이트의 데이터를 담은 수십 억 줄의 데이터 세트를 다룰 수 있도록 해주는 온라인 분석 프로세싱(OLAP) 시스템으로, 기업이 빅 데이터를 실시간으로 다룰 수 있도록 하는데 초점을 맞추고 있다. 빅 쿼리는 현재 웹 기반의 사용자 인터페이스, REST API, 커맨드 라인 도구 등 다양한 방법을 통해 이용할 수 있으며 데이터는 구글 빅 쿼리 서버에 CSV 형식으로 저장하게 된다. 이용 요금요금은 저장된 데이터 용량 및 쿼리 볼륨에 따라 달라진다. 자세한 정보는 관련 웹 페이지에서 찾아볼 수 있다. 구글에 따르면 몇몇 빅 쿼리 얼리 어답터들은 빅 쿼리 상에서 애플리케이션을 구축하기도 했다. 예를 들어 클래리틱스(Claritics)라는 기업은 게임 개발자들이 실시간으로 게이머 행동을 분석할 수 있도록 하는 도구를 개발했다. 빅 쿼리는 OLTP(online transaction processing) 업무를 위한 도구가 아니며 데이터 세트를 변형하는 용도에도 어울리지 않는다. 보다 전통적인 관계형 SQL 데이터베이스를 필요로 하는 기업들이라면 회사의 클라우드 기반 데이터베이스인 '구글 클라우드 SQL'이 적합하다고 구글측은 설명했다. 이 서비스는 풀 SQL 신택스와 테이블을 지원하기 때문이다. 빅 쿼리는 2년 전 구글 I/O 개발자 컨퍼런스에서 처음 공개됐으며 지난 해 11월 웹 기반의 UI가 추가되는 등 개선사항이 발표됐었다. ciokr@idg.co.kr

구글 빅 데이터 빅쿼리 빅 쿼리

2012.05.02

구글의 빅 쿼리(BigQuery)가 공식적으로 일반에게 공개됐다고 구글이 지난 1일 밝혔다. 빅 쿼리는 대용량 데이터 세트를 분석할 수 있도록 한 클라우드 기반의 서비스다. 구글에 따르면 빅 쿼리는 수 테라바이트의 데이터를 담은 수십 억 줄의 데이터 세트를 다룰 수 있도록 해주는 온라인 분석 프로세싱(OLAP) 시스템으로, 기업이 빅 데이터를 실시간으로 다룰 수 있도록 하는데 초점을 맞추고 있다. 빅 쿼리는 현재 웹 기반의 사용자 인터페이스, REST API, 커맨드 라인 도구 등 다양한 방법을 통해 이용할 수 있으며 데이터는 구글 빅 쿼리 서버에 CSV 형식으로 저장하게 된다. 이용 요금요금은 저장된 데이터 용량 및 쿼리 볼륨에 따라 달라진다. 자세한 정보는 관련 웹 페이지에서 찾아볼 수 있다. 구글에 따르면 몇몇 빅 쿼리 얼리 어답터들은 빅 쿼리 상에서 애플리케이션을 구축하기도 했다. 예를 들어 클래리틱스(Claritics)라는 기업은 게임 개발자들이 실시간으로 게이머 행동을 분석할 수 있도록 하는 도구를 개발했다. 빅 쿼리는 OLTP(online transaction processing) 업무를 위한 도구가 아니며 데이터 세트를 변형하는 용도에도 어울리지 않는다. 보다 전통적인 관계형 SQL 데이터베이스를 필요로 하는 기업들이라면 회사의 클라우드 기반 데이터베이스인 '구글 클라우드 SQL'이 적합하다고 구글측은 설명했다. 이 서비스는 풀 SQL 신택스와 테이블을 지원하기 때문이다. 빅 쿼리는 2년 전 구글 I/O 개발자 컨퍼런스에서 처음 공개됐으며 지난 해 11월 웹 기반의 UI가 추가되는 등 개선사항이 발표됐었다. ciokr@idg.co.kr

2012.05.02

IDG 설문조사

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.6