Offcanvas

BI / 빅데이터 | 애널리틱스 / 애플리케이션 / 클라우드

AWS, 신규 서버리스 쿼리 서비스 ‘아마존 아테나’ 출시

2016.12.06 편집부  |  CIO KR
아마존웹서비스(Amazon Web Services 이하 AWS)는 서버리스(serverless) 쿼리 서비스인, ‘아마존 아테나(Amazon Athena)’를 출시했다고 밝혔다.

이 서비스는 스탠다드 SQL을 사용해 아마존 S3에서의 직접적인 데이터 분석을 용이하게 한다고 업체 측은 설명했다. AWS 매니지먼트 콘솔(AWS Management Console)에서 몇 번의 클릭만으로 고객들은 아마존 S3에 저장된 데이터에서 아마존 아테나를 찾을 수 있고, 스탠다드 SQL을 사용해 쿼리를 실행 한 후 몇 초 만에 결과를 얻어낼 수 있다.

아마존 아테나를 사용하면 관리나 튜닝(tune)을 위한 클러스터나, 설치와 운영을 위한 인프라가 필요하지 않으며, 고객들은 사용하는 쿼리에 대해서만 지불하면 된다. 아마존 아테나는 병렬로 커리를 실행해 자동으로 용량을 조절하고 결과를 빠르게 도출하며, 대용량 데이터세트나 복잡한 쿼리도 가능하다.

아마존 레드시프트(Amazon Redshift)나 아마존 EMR 같은 AWS의 분석 서비스는 기업의 규모에 관계없이 페타바이트 규모(petabyte-scale)의 분석을 사용할 수 있게 했다. 아마존 레드시프트를 통해 고객들은 구조화(structured)된 대용량 데이터에 대해 복잡한 쿼리를 수행하고 초고속으로 결과를 도출한다. 비 구조화 데이터(unstructured data)의 경우, 아마존 EMP는 아파치 스팍(Apache Spark), 프레스토(Pressto), 하이브(Hive), 피그(Pig) 등의 대중적인 분산 프레임워크(distributed frameworks)를 사용해 다이나믹하게 확장할 수 있는 클러스터 상에서 방대한 양의 데이터를 빠르고 비용 효율적으로 처리하고 분석한다.

이제 아마존 아테나로, 아마존 S3에 저장된 데이터를 분석하는 것은 SQL 쿼리를 쓰는 것만큼이나 간단하다고 업체 측은 설명했다. 아마존 아테나는 표준 SQL을 지원하고 프레스토(Presto)를 사용하며, CSV, JSON, ORC, Parquet을 포함한 다양한 스탠다드 데이터 포맷으로 작업할 수 있다.

이 서비스는 신속한 애드혹(ad-hoc) 쿼리에 이상적이고, 아마존 퀵사이트를 통합해 시각화가 용이하다. 그리고 라지 조인스, 윈도우 기능, 배열 등의 복잡한 분석을 처리할 수 있다. 아마존 아테나는 다양한 가용 영역(Availability Zones; AZ)에서 컴퓨트 리소스를 사용해 쿼리를 실행하고, 데이터 저장소로 Amazon S3를 사용하기 때문에 다양한 기관과 각 기관의 여러 기기들에 중복으로 저장된 데이터에 대해 고가용성을 제공하고 영구적으로 관리할 수 있게 한다.

한편, 아마존 아테나는 현재 미국의 동부(버지니아 북부), 서부(오레곤)에서 사용할 수 있으며, 수개월 안에 점차적으로 사용 가능 지역을 확대해 나갈 예정이다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.