2016.03.18

기업과 하둡 데이터를 연결하는 'SAP의 HANA 보라'

Thor Olavsrud | CIO
SAP이 최근 인메모리 쿼리 엔진인 SAP HAVA 보라(Vora)를 대대적으로 공급한다고 발표했다. 이는 기업 및 기관이 기업용 하둡(Hadoop) 시스템과 다른 분산형 데이터 소스에 저장해 둔 데이터를 상황(Contextual) 분석하는데 도움을 줄 수 있다고 회사는 설명했다.  


Credit: Thinkstock

SAP는 지난해 9월 SAP HAVA 보라 소프트웨어를 처음 발표했다. 그러나 SAP 클라우드 플랫폼 및 데이터 관리 부문 책임자이자 부사장 켄 차이는 소프트웨어 개발에 수년을 투자했다고 강조했다. 켄 차이는 "우리는 대기업 워크로드와 빅데이터 워크로드에 분산형 컴퓨팅 프레임워크를 실현시키기 원했다"고 말했다.

HANA 보라를 이용하는 기업과 기관은 익숙한 OLAP(Online Analytical Processing)과 프로그래밍 언어를 이용해, 기업과 하둡 시스템에 저장한 모든 데이터를 일관된 방식으로 분석할 수 있다.

이는 기업 데이터와 계속 폭증하는 빅데이터의 간극을 연결하는 역할을 한다. 이는 기업용 애플리케이션, 데이터웨어하우스, 데이터 호수, IoT 센서에서 수집한 수많은 운영 데이터, 상황 데이터에서 인사이트를 뽑아낼 수 있도록 설계된 기술이다. 아파치 스파크(Apache Spark) 실행 프레임워크를 이용해, 하둡을 인터랙티브 분석을 한다.

- 데이터를 서로 연결, 상황에 딱 맞는 의사결정을 내림. 보라는 비즈니스 운영 데이터와 기존의 비구조화 데이터 소스를 결합해 더욱 강력한 분석을 제공한다.

- 쉽게 빅데이터를 관리. 보라는 하둡 클러스터에서 데이터를 로컬 처리, 데이터 소유권과 통합에 수반되는 도전과제를 없앤다.

- 하둡에서의 OLAP 모델링 기능. 보라를 이용해 수천 노드에 분산된 수많은 하둡 데이터를 실시간 심층 분석할 수 있다.

SAP는 스파크 개발자가 설립한 데이터브릭스(Databricks), 하둡 배포판 벤더인 클라우데라(Cloudera), 호튼웍스(Hortonworks), 맵알 테크놀로지스(MapR Technologies)와 협력해 HANA 보라를 지원한다. 또한 SAP는 소프트웨어 개발에 힘을 실어주기 위해 아파치 스파크 오픈소스 생태계에 보라 코드 일부를 제공했다.

맵알 테크놀로지스 제품 마케팅 부사장 스티브 울릿지는 "빅데이터가 아주 중요한 기술로 발전하면서, 하둡에서 OLAP 같은 기존 분석 기법을 널리 활용할 수 있어야 한다는 요구가 높아지고 있는 추세다. SAP HANA 보라는 분석가와 데이터 과학자가 구조화 데이터 및 비구조화 데이터 연결에 스파크에 기반을 둔 OLAP 분석 솔루션을 이용할 수 있도록 해준다"고 설명했다.

켄 차이에 따르면, SAP는 스파크 공동체에 공급사슬 계획, 재무 기획, 리소스 제약 최적화 등의 전문성을 기여하고, 이 전문성을 바탕으로 스파크 공동체가 기업 개발자의 요구에 부합하도록 도울 예정이다.

미국 아칸소와 루이지애나, 미네소타, 미시시피, 오클라호마, 텍사스에 전기 및 천연 가스를 공급하는 유틸리티 업체인 텍사스 휴스톤 소재 센터포인트 에너지(Centerpointe Energy)는 분산된 기업 데이터 프레임워크를 통합하기 위해 SAP HANA 플랫폼과 SAP HANA 보라를 가장 먼저 구현한 SAP 고객 가운데 하나다.

센터포인트 에너지는 230만 명의 소비자에게 전기를 공급하고 있으며, 15분마다 전기 계량 데이터를 수집한다. 이에 막대한 데이터 스토리지 비용이 발생한다.
그러나 켄 차이는 SAP와 센터포인트 에너지가 하둡과 SAP HANA, SAP HANA 보라를 이용, 6개월 만에 50억 개가 넘는 데이터 기록을 처리하는 테스트 환경을 설계했다고 강조했다.

켄 차이는 "이 유틸리티는 중앙 데이터웨어하우스에 저장된 데이터를 처리하고, 데이터 저장소에 저장된 스마트 미터기(계량기) 데이터에서 상황과 직결된 인사이트를 추가할 수 있는 아주 큰 빅데이터 웨어하우스데이터 처리 프레임워크를 창조하기 원했다"고 말했다.

테스트용 배포는 성공적이었다. 이 유틸리티는 HANA 플랫폼과 HANA 보라를 구현하고, 이를 토대로 표준화를 할 계획을 갖고 있다.

센터포인트 에너지 CIO이자 수석 부사장 게리 헤이스는 "운영을 발전시키고, 사물인터넷과 예측 분석 이니셔티브를 혁신하는데 적합한 솔루션이 SAP HANA와 SAP HANA 보라를 통합한 솔루션이라는 점이 입증됐다. 우리는 SAP의 도움을 받아, 고객에게 더 나은 서비스를 제공하는 '살아 숨쉬는' 디지털 기업으로 변모하고 있다"고 말했다.

켄 차이는 "HANA 플랫폼과 HANA 보라가 서로를 보완하는 기술이지만, 보라만 별개로 활용할 수도 있다"고 말했다. editor@itworld.co.kr



2016.03.18

기업과 하둡 데이터를 연결하는 'SAP의 HANA 보라'

Thor Olavsrud | CIO
SAP이 최근 인메모리 쿼리 엔진인 SAP HAVA 보라(Vora)를 대대적으로 공급한다고 발표했다. 이는 기업 및 기관이 기업용 하둡(Hadoop) 시스템과 다른 분산형 데이터 소스에 저장해 둔 데이터를 상황(Contextual) 분석하는데 도움을 줄 수 있다고 회사는 설명했다.  


Credit: Thinkstock

SAP는 지난해 9월 SAP HAVA 보라 소프트웨어를 처음 발표했다. 그러나 SAP 클라우드 플랫폼 및 데이터 관리 부문 책임자이자 부사장 켄 차이는 소프트웨어 개발에 수년을 투자했다고 강조했다. 켄 차이는 "우리는 대기업 워크로드와 빅데이터 워크로드에 분산형 컴퓨팅 프레임워크를 실현시키기 원했다"고 말했다.

HANA 보라를 이용하는 기업과 기관은 익숙한 OLAP(Online Analytical Processing)과 프로그래밍 언어를 이용해, 기업과 하둡 시스템에 저장한 모든 데이터를 일관된 방식으로 분석할 수 있다.

이는 기업 데이터와 계속 폭증하는 빅데이터의 간극을 연결하는 역할을 한다. 이는 기업용 애플리케이션, 데이터웨어하우스, 데이터 호수, IoT 센서에서 수집한 수많은 운영 데이터, 상황 데이터에서 인사이트를 뽑아낼 수 있도록 설계된 기술이다. 아파치 스파크(Apache Spark) 실행 프레임워크를 이용해, 하둡을 인터랙티브 분석을 한다.

- 데이터를 서로 연결, 상황에 딱 맞는 의사결정을 내림. 보라는 비즈니스 운영 데이터와 기존의 비구조화 데이터 소스를 결합해 더욱 강력한 분석을 제공한다.

- 쉽게 빅데이터를 관리. 보라는 하둡 클러스터에서 데이터를 로컬 처리, 데이터 소유권과 통합에 수반되는 도전과제를 없앤다.

- 하둡에서의 OLAP 모델링 기능. 보라를 이용해 수천 노드에 분산된 수많은 하둡 데이터를 실시간 심층 분석할 수 있다.

SAP는 스파크 개발자가 설립한 데이터브릭스(Databricks), 하둡 배포판 벤더인 클라우데라(Cloudera), 호튼웍스(Hortonworks), 맵알 테크놀로지스(MapR Technologies)와 협력해 HANA 보라를 지원한다. 또한 SAP는 소프트웨어 개발에 힘을 실어주기 위해 아파치 스파크 오픈소스 생태계에 보라 코드 일부를 제공했다.

맵알 테크놀로지스 제품 마케팅 부사장 스티브 울릿지는 "빅데이터가 아주 중요한 기술로 발전하면서, 하둡에서 OLAP 같은 기존 분석 기법을 널리 활용할 수 있어야 한다는 요구가 높아지고 있는 추세다. SAP HANA 보라는 분석가와 데이터 과학자가 구조화 데이터 및 비구조화 데이터 연결에 스파크에 기반을 둔 OLAP 분석 솔루션을 이용할 수 있도록 해준다"고 설명했다.

켄 차이에 따르면, SAP는 스파크 공동체에 공급사슬 계획, 재무 기획, 리소스 제약 최적화 등의 전문성을 기여하고, 이 전문성을 바탕으로 스파크 공동체가 기업 개발자의 요구에 부합하도록 도울 예정이다.

미국 아칸소와 루이지애나, 미네소타, 미시시피, 오클라호마, 텍사스에 전기 및 천연 가스를 공급하는 유틸리티 업체인 텍사스 휴스톤 소재 센터포인트 에너지(Centerpointe Energy)는 분산된 기업 데이터 프레임워크를 통합하기 위해 SAP HANA 플랫폼과 SAP HANA 보라를 가장 먼저 구현한 SAP 고객 가운데 하나다.

센터포인트 에너지는 230만 명의 소비자에게 전기를 공급하고 있으며, 15분마다 전기 계량 데이터를 수집한다. 이에 막대한 데이터 스토리지 비용이 발생한다.
그러나 켄 차이는 SAP와 센터포인트 에너지가 하둡과 SAP HANA, SAP HANA 보라를 이용, 6개월 만에 50억 개가 넘는 데이터 기록을 처리하는 테스트 환경을 설계했다고 강조했다.

켄 차이는 "이 유틸리티는 중앙 데이터웨어하우스에 저장된 데이터를 처리하고, 데이터 저장소에 저장된 스마트 미터기(계량기) 데이터에서 상황과 직결된 인사이트를 추가할 수 있는 아주 큰 빅데이터 웨어하우스데이터 처리 프레임워크를 창조하기 원했다"고 말했다.

테스트용 배포는 성공적이었다. 이 유틸리티는 HANA 플랫폼과 HANA 보라를 구현하고, 이를 토대로 표준화를 할 계획을 갖고 있다.

센터포인트 에너지 CIO이자 수석 부사장 게리 헤이스는 "운영을 발전시키고, 사물인터넷과 예측 분석 이니셔티브를 혁신하는데 적합한 솔루션이 SAP HANA와 SAP HANA 보라를 통합한 솔루션이라는 점이 입증됐다. 우리는 SAP의 도움을 받아, 고객에게 더 나은 서비스를 제공하는 '살아 숨쉬는' 디지털 기업으로 변모하고 있다"고 말했다.

켄 차이는 "HANA 플랫폼과 HANA 보라가 서로를 보완하는 기술이지만, 보라만 별개로 활용할 수도 있다"고 말했다. editor@itworld.co.kr

X