2017.12.21

익스피디아, 호텔스닷컴, 테슬라 공통점은 '하둡'··· 12가지 사례

Scott Carey | Computerworld UK

지난 2015년 포레스터는 기업의 하둡 도입이 필수가 되고, 데이터에서 가치를 끌어내고자 하는 모든 기업은 최소한 하둡을 고려해야 한다고 예측한 바 있다.

하둡이란 무엇인가? 오픈소스 아파치 소프트웨어 재단은 하둡을 ‘분산 컴퓨팅 플랫폼’ 또는 ‘간단한 프로그래밍 모델을 사용해 여러 대의 컴퓨터에서 대규모 데이터 세트를 분산 처리할 수 있는 프레임워크’라고 설명하고 있다.

재단에 따르면, 고가용성을 제공하기 위해 하드웨어에 의존하는 게 아니라 라이브러리 자체는 애플리케이션 계층에서 오류를 감지하고 처리하여 컴퓨터 클러스터 상단에 고가용성 서비스를 제공하도록 설계했다.

하둡은 속도, 신뢰성, 비용 절감 등의 장점으로 기업에 침투했으며 기업은 다양한 규모로 기술을 도입하기 시작했다.

현재 통신사, 대기업 은행, 항공사, 소매/유통 등의 기업이 하둡을 도입해 사용하고 있으며 그 가운데 12개 사례를 소개한다.

1. BT
BT는 아파치 하둡이 제공하는 클라우데라 엔터프라이즈 데이터 허브를 사용하여 엔지니어에 대한 요청-응대를 줄였다.

네트워크의 특성을 분석함으로써 BT는 느린 인터넷 속도가 네트워크나 고객 문제 때문인지를 확인할 수 있다. 그런 다음 엔지니어가 문제를 해결할 가능성이 있는지 평가할 수 있다.

클라우데라 허브는 하둡 환경에 저장된 고객 데이터의 통일된 뷰를 제공한다. BT는 도입 후 1년 이내에 200~250%의 투자 수익을 올렸다.

또한 BT는 고객이 엔지니어의 위치를 추적할 수 있게 해주는 SMS 및 이메일 알림 시스템인 ‘내 엔지니어 보기(View My Engineer)’ 같은 새로운 서비스를 만드는데도 하둡을 사용했다. 이 회사는 현재 예측 분석을 사용하여 차량 유지 보수를 개선하고자 한다.

2. 스코틀랜드 왕립 은행


스코틀랜드 왕립 은행(RBS)은 실리콘밸리의 트리팩타(Trifacta)와 협력해 하둡 데이터 레이크를 차례로 얻었으므로 고객이 은행 온라인을 통해 얻은 채팅 대화에서 통찰력을 얻을 수 있다.

RBS는 약 25만 개의 채팅 로그와 관련 메타 데이터를 매월 저장한다. 은행은 이 비정형 데이터를 하둡에 저장한다. 트리팩타를 사용하기 전에는 사용자 기반에 대한 거대한 미개척 정보를 저장했었다

3. CERN


스위스의 대형 강입자 충돌기(Large Hadron Collider)는 세계에서 가장 크고 강력한 기계 중 하나다. 1억 5,000만 개의 센서가 장착돼 매초 1페타바이트의 데이터를 생성하며, 전송 데이터는 항상 증가하고 있다.

CERN 연구원인 마누엘 마틴 마르퀘즈는 "데이터가 규모와 복잡성 면에서 확장됐다. 우리가 가진 역할은 이러한 확장 가능한 요구 사항에 부합하는 것으로 하둡 클러스터를 실행한다"고 말했다.

그는 "단순한 방식으로 기계를 통해 입자를 분사하고 충돌을 일으킨 다음 해당 데이터를 저장하고 분석한다"고 설명했다.

마르퀘즈에 따르면, 하둡을 사용함으로써 하드웨어 비용과 유지보수 비용을 제한할 수 있다.

4. 영국 우정공사


영국 우정공사(Royal Mail)는 하둡을 사용해 빅데이터 전략을 위한 기본 요소를 확보했다.

영국 우정공사의 기술 데이터 그룹 이사인 토마스 리-워렌은 <컴퓨터월드UK>와의 인터뷰에서 하둡 투자가 내부 데이터로부터 더 많은 가치를 창출할 수 있는 기반이라고 밝혔다. 리-워렌은 "많은 데이터를 보유하고 있으며, 9노드를 통해 100테라바이트의 영역에서 운영될 것이다"고 설명했다.

이 사업부는 호튼웍스의 하둡 분석 툴을 사용하여 조직 전체에서 데이터를 관리하는 방식을 바꾸어 데이터웨어하우스에 보관된 독점 정보에 대한 통찰력을 분석팀에 제공한다.

5. 영국항공


영국항공(British Airways)은 2015년 4월 최초로 하둡을 엔터프라이즈 데이터웨어하우스(EDW) 플랫폼에 고비용으로 보관된 법적 소송 자료 보관소로 구축했다.

영국항공의 데이터 개발 관리자인 알란 스파노스에 따르면, 호튼웍스 2.2 HDP를 도입한 후 1년 이내에 투자를 회수하고 새로운 프로젝트에 75% 이상의 여유 공간을 제공할 수 있게 됐으며 이는 재무 팀의 비용 절감으로 이어진다.

스파노스는 "비즈니스 인텔리전스에서 이 기술을 채용하여 직무 역할의 일부를 수행하지 않으면 몇 년 내에 존재하지 않을 것이다. 지금까지 전통적인 기술로만 갈 수 있다. 여전히 아키텍처 내에서 자리를 지니고 있지만, 솔직히 말하면, 이것은 당신이 있어야 할 곳이다"고 이야기했다.
 


6. 웨스턴유니온


글로벌 결제 제공 업체인 웨스턴유니온(Western Union)은 2014년 클라우데라의 하둡 기반 데이터 분석 플랫폼을 구현하여 고객에게 보다 개인화된 경험을 제공했다.

클라우데라는 이를 ‘세계에서 가장 큰 엔터프라이즈 데이터 세트 중 하나’로 꼽았으며, 웨스턴유니온은 실시간 분석을 좀더 효율적으로 저장하고 처리할 수 있게 됐다.

클라우데라의 아파치 하둡 구현은 웨스턴유니온이 기업 데이터 허브에서 글로벌 고객 데이터를 중앙 집중화하고 패턴 인식 및 예측 모델링을 지원할 수 있도록 돕는다. 대형 데이터 분석 플랫폼은 웨스턴유니온 고객을 위해 여러 제품 및 서비스 제공 채널에서 보다 개인화된 경험을 창출하기 위한 것이다.
 
2017.12.21

익스피디아, 호텔스닷컴, 테슬라 공통점은 '하둡'··· 12가지 사례

Scott Carey | Computerworld UK

지난 2015년 포레스터는 기업의 하둡 도입이 필수가 되고, 데이터에서 가치를 끌어내고자 하는 모든 기업은 최소한 하둡을 고려해야 한다고 예측한 바 있다.

하둡이란 무엇인가? 오픈소스 아파치 소프트웨어 재단은 하둡을 ‘분산 컴퓨팅 플랫폼’ 또는 ‘간단한 프로그래밍 모델을 사용해 여러 대의 컴퓨터에서 대규모 데이터 세트를 분산 처리할 수 있는 프레임워크’라고 설명하고 있다.

재단에 따르면, 고가용성을 제공하기 위해 하드웨어에 의존하는 게 아니라 라이브러리 자체는 애플리케이션 계층에서 오류를 감지하고 처리하여 컴퓨터 클러스터 상단에 고가용성 서비스를 제공하도록 설계했다.

하둡은 속도, 신뢰성, 비용 절감 등의 장점으로 기업에 침투했으며 기업은 다양한 규모로 기술을 도입하기 시작했다.

현재 통신사, 대기업 은행, 항공사, 소매/유통 등의 기업이 하둡을 도입해 사용하고 있으며 그 가운데 12개 사례를 소개한다.

1. BT
BT는 아파치 하둡이 제공하는 클라우데라 엔터프라이즈 데이터 허브를 사용하여 엔지니어에 대한 요청-응대를 줄였다.

네트워크의 특성을 분석함으로써 BT는 느린 인터넷 속도가 네트워크나 고객 문제 때문인지를 확인할 수 있다. 그런 다음 엔지니어가 문제를 해결할 가능성이 있는지 평가할 수 있다.

클라우데라 허브는 하둡 환경에 저장된 고객 데이터의 통일된 뷰를 제공한다. BT는 도입 후 1년 이내에 200~250%의 투자 수익을 올렸다.

또한 BT는 고객이 엔지니어의 위치를 추적할 수 있게 해주는 SMS 및 이메일 알림 시스템인 ‘내 엔지니어 보기(View My Engineer)’ 같은 새로운 서비스를 만드는데도 하둡을 사용했다. 이 회사는 현재 예측 분석을 사용하여 차량 유지 보수를 개선하고자 한다.

2. 스코틀랜드 왕립 은행


스코틀랜드 왕립 은행(RBS)은 실리콘밸리의 트리팩타(Trifacta)와 협력해 하둡 데이터 레이크를 차례로 얻었으므로 고객이 은행 온라인을 통해 얻은 채팅 대화에서 통찰력을 얻을 수 있다.

RBS는 약 25만 개의 채팅 로그와 관련 메타 데이터를 매월 저장한다. 은행은 이 비정형 데이터를 하둡에 저장한다. 트리팩타를 사용하기 전에는 사용자 기반에 대한 거대한 미개척 정보를 저장했었다

3. CERN


스위스의 대형 강입자 충돌기(Large Hadron Collider)는 세계에서 가장 크고 강력한 기계 중 하나다. 1억 5,000만 개의 센서가 장착돼 매초 1페타바이트의 데이터를 생성하며, 전송 데이터는 항상 증가하고 있다.

CERN 연구원인 마누엘 마틴 마르퀘즈는 "데이터가 규모와 복잡성 면에서 확장됐다. 우리가 가진 역할은 이러한 확장 가능한 요구 사항에 부합하는 것으로 하둡 클러스터를 실행한다"고 말했다.

그는 "단순한 방식으로 기계를 통해 입자를 분사하고 충돌을 일으킨 다음 해당 데이터를 저장하고 분석한다"고 설명했다.

마르퀘즈에 따르면, 하둡을 사용함으로써 하드웨어 비용과 유지보수 비용을 제한할 수 있다.

4. 영국 우정공사


영국 우정공사(Royal Mail)는 하둡을 사용해 빅데이터 전략을 위한 기본 요소를 확보했다.

영국 우정공사의 기술 데이터 그룹 이사인 토마스 리-워렌은 <컴퓨터월드UK>와의 인터뷰에서 하둡 투자가 내부 데이터로부터 더 많은 가치를 창출할 수 있는 기반이라고 밝혔다. 리-워렌은 "많은 데이터를 보유하고 있으며, 9노드를 통해 100테라바이트의 영역에서 운영될 것이다"고 설명했다.

이 사업부는 호튼웍스의 하둡 분석 툴을 사용하여 조직 전체에서 데이터를 관리하는 방식을 바꾸어 데이터웨어하우스에 보관된 독점 정보에 대한 통찰력을 분석팀에 제공한다.

5. 영국항공


영국항공(British Airways)은 2015년 4월 최초로 하둡을 엔터프라이즈 데이터웨어하우스(EDW) 플랫폼에 고비용으로 보관된 법적 소송 자료 보관소로 구축했다.

영국항공의 데이터 개발 관리자인 알란 스파노스에 따르면, 호튼웍스 2.2 HDP를 도입한 후 1년 이내에 투자를 회수하고 새로운 프로젝트에 75% 이상의 여유 공간을 제공할 수 있게 됐으며 이는 재무 팀의 비용 절감으로 이어진다.

스파노스는 "비즈니스 인텔리전스에서 이 기술을 채용하여 직무 역할의 일부를 수행하지 않으면 몇 년 내에 존재하지 않을 것이다. 지금까지 전통적인 기술로만 갈 수 있다. 여전히 아키텍처 내에서 자리를 지니고 있지만, 솔직히 말하면, 이것은 당신이 있어야 할 곳이다"고 이야기했다.
 


6. 웨스턴유니온


글로벌 결제 제공 업체인 웨스턴유니온(Western Union)은 2014년 클라우데라의 하둡 기반 데이터 분석 플랫폼을 구현하여 고객에게 보다 개인화된 경험을 제공했다.

클라우데라는 이를 ‘세계에서 가장 큰 엔터프라이즈 데이터 세트 중 하나’로 꼽았으며, 웨스턴유니온은 실시간 분석을 좀더 효율적으로 저장하고 처리할 수 있게 됐다.

클라우데라의 아파치 하둡 구현은 웨스턴유니온이 기업 데이터 허브에서 글로벌 고객 데이터를 중앙 집중화하고 패턴 인식 및 예측 모델링을 지원할 수 있도록 돕는다. 대형 데이터 분석 플랫폼은 웨스턴유니온 고객을 위해 여러 제품 및 서비스 제공 채널에서 보다 개인화된 경험을 창출하기 위한 것이다.
 
X