2012.05.10

비즈니스 분석에 불어오는 5가지 트렌드 ‘그리고 대처법’

David F. Carr | CIO

빅 데이터, 빨라진 인프라스트럭처, 비용 인하, 모빌리티, 소셜 미디어. 존 행콕, 숍질라를 비롯한 유수의 기업 CIO들은 이러한 IT 트렌드가 데이터를 처리해 가치 있는 비즈니스 정보를 얻는 방법을 바꿔놓고 있다고 입을 모았다.

애널리틱스 및 비즈니스 인텔리전스 기술의 발전으로 인해 이제CIO들은 더 큰 비즈니스 데이터를 더 빠르고 저렴하면서 유연하게 활용할 수 있게 되었다.

최근의 트렌드는 애널리틱스 문제를 해결하는데 초점을 맞추고 있다. 많은 기관들이 수집한 데이터를 활용하기 위해 노력함에 따라 거대하고 다양한 데이터 세트를 관리하고 분석하기 위한 기술이 등장하고 있다. 고도화된 애널리틱스의 출현은 기업들이 이전보다 더욱 복잡한 질문을 던지고 기업을 운영하는데 더욱 도움이 되는 정보를 제공할 수 있음을 의미한다.

CIO들은 인터뷰에서 빅 데이터의 등장, 더욱 빠른 처리를 위한 기술, IT 상품의 비용 하락, 모바일 기기확산, 소셜 미디어의 확산 등 5가지의 공통된 IT 트렌드를 지적했다.

1. 빅 데이터
빅 데이터는 전통적인 데이터 저장소에 질서정연하게 정리하기 어려운 매우 거대한 데이터 세트를 의미한다. 웹 크롤러(Web Crawler) 데이터, 소셜 미디어 피드(Feed), 서버 로그뿐만이 아니라 공급망과 산업/환경/감시 센서로부터 얻은 모든 데이터 때문에 기업 데이터는 과거 어느 때보다도 더욱 복잡해지고 있다.

모든 기업이 거대하고 구조화되지 않은 데이터 세트를 처리하기 위한 기술을 필요로 하는 것은 아니지만 베리스크 어낼리틱스(Verisk Analytics)의 CIO 페리 로텔라는 모든 CIO가 빅 데이터 분석 툴에 관심을 가져야 한다고 주장하고 있다. 베리스크는 금융기관의 위험 평가와 보험회사들의 가짜 청구 데이터 규명을 돕는 기업으로의 2010년 10억 달러 매출을 기록했던 바 있다.

로텔라는 데이터는 많을수록 좋다는 자세로 압도적인 양의 데이터를 수용해야 한다며 "데이터 사이의 미리 알아낼 수 없는 패턴과 상관관계를 찾는" 업무도 수행해야 한다고 전했다.

빅 데이터는 "폭발적인" 트렌드라고 의료보장 프로그램뿐만이 아니라 사기업들을 위한 의료보장 비용을 억제하는데 도움을 주고 있는 HMS의 CIO 신시아 너스터드는 말했다. 참고로 이 기업은 40여 개 주의 의료 및 복지 서비스 프로그램과 130개 이상의 의료보장계획을 지원하고 있다. HMS 덕분에 상기 프로그램들은 2010년에 법률 소송에서 18억 달러 이상의 손실을 모면했고 잘못된 지출을 막아 수십억 달러를 절약할 수 있었다.

너스터드는 "우리는 구조화된 데이터와 구조화되지 않은 엄청난 데이터를 수집 및 추적하고 있다. 그러나 이것들로 우리가 무엇을 할 수 있는지 항상 알고 있는 것은 아니다"라고 말했다.

빅 데이터 기술과 관련하여 가장 많이 거론되는 용어는 하둡(Hadoop)이다. 이것은 본래 웹 검색 색인을 수집하기 위해서 개발된 분산형 데이터 처리 오픈 소스 플랫폼이다. 이것은 기발한 방식으로 웹 규모의 데이터 정리하기 위해 등장한 소위 말하는 ‘NoSQL’ 기술(코치DB(CouchDB)와 망고DB(MangoDB) 포함) 중 하나다.

하둡은 데이터를 수백 또는 수천 개의 서버에 할당하여 수 페타바이트의 데이터를 처리할 수 있게 한다. 각 서버는 마스터 작업 스케줄러가 대조할 수 있는 결과를 제공하게 된다. 하둡은 분석을 위한 데이터 준비에 사용되거나 그 자체로 데이터를 분석하는 툴로서 사용될 수 있다. 또한 수천 대에 이르는 여분의 서버를 보유하고 있지 못한 기업도 아마존 등의 클라우드 벤더로부터 하둡 인스턴스에 대한 주문형(On-demand) 접속 권한을 구매할 수 있다.

너스터드는 현재 NoSQL 기술의 활용을 검토하고 있다. 물론, 의료보장제도의 거대한 청구 데이터베이스를 위한 용도는 아니다. 그녀는 여기에는 구조화된 데이터가 포함되고 전통적인 데이터 저장 기술을 이용해 처리할 수 있다면서, 관계형 기술로 해결할 수 있는 문제를 처리할 때 전통적인 관계형 데이터베이스 관리를 외면하는 것은 비상식적이라고 말했다.

하지만 너스터드는 다양한 양상을 띨 수 있는 환자의 방문 기록을 분석하는 등 가짜 또는 낭비 분석에서 하둡이 제 역할을 할 수 있을 것으로 보고 있다.

실질적으로 하둡을 경험한 바 있는 로텔라와 숍질라(Shopzilla)의 CIO 조디 멀키는 "우리는 데이터 저장소와 같은 목적으로 하둡을 사용하고 있다"라며 더욱 중요한 것은 "이전에는 불가능했던 진정으로 흥미로운 분석을" 추구하는 것이라고 말했다.

예를 들어, 가격비교 사이트인 숍질라는 매일 수 테라바이트의 데이터를 수집하고 있다. 그는 "데이터의 표본을 채취하고 분할하기 전까지는 데이터의 규모 때문에 작업이 너무 방대했다"면서 숍질라가 하둡을 통해 원본 데이터를 분석하면서 그 사이의 과정을 생략할 수 있게 됐다고 전했다.

인디애나주 사우스웨스트의 지역 병원 굿 사마리탄(Good Samaritan) 병원의 상황은 좀 다르다. CIO 척 크리스찬은 "우리는 빅 데이터라고 할만한 것이 없다"라고 말했다. 그러나 그는 규제상의 요건 때문에 엄청난 양의 전자 의무기록 등 새로운 범주의 데이터를 저장해야 한다.

그는 이런 데이터로부터 의료서비스의 질에 관한 정보를 얻을 수 있는 상당한 잠재력이 있는 것은 사실이지만 그런 작업은 지역 또는 국립 의료기관에 더욱 적합하다고 말한다. 그가 획기적인 신기술에 투자할 가능성은 낮은 것이다.

아일랜드 원 리조트(Island One Resorts)의 CIO 존 터넌트는 플로리다에서 8곳의 공동 리조트를 관리하고 있는 회사를 위해 복잡한 담보 포트폴리오 분석을 운용하기 위한 경제적인 방법으로써 하둡 인스턴스를 클라우드에서 활용하는 방안을 심각하게 검토하고 있다. 그는 "우리가 현재 직면하고 있는 실제적인 문제에 대한 잠재적인 솔루션"라 말했다.  

2. 빨라지는 비즈니스 분석
빅 데이터 기술은 더 빠른 분석을 향한 트렌드를 구성하는 한 요소라고 켄터키 대학(University of Kentucky)의 CIO 빈스 켈렌은 평가했다. 그는 "우리가 진정으로 원하는 것은 엄청나게 많은 데이터에 관한 고도의 분석이다. 빠른 속도를 원하기 때문에" 얼마나 많은 데이터를 보유하고 있는가보다 얼마나 효율적으로 분석할 수 있느냐가 더욱 중요하다고 말했다.




2012.05.10

비즈니스 분석에 불어오는 5가지 트렌드 ‘그리고 대처법’

David F. Carr | CIO

빅 데이터, 빨라진 인프라스트럭처, 비용 인하, 모빌리티, 소셜 미디어. 존 행콕, 숍질라를 비롯한 유수의 기업 CIO들은 이러한 IT 트렌드가 데이터를 처리해 가치 있는 비즈니스 정보를 얻는 방법을 바꿔놓고 있다고 입을 모았다.

애널리틱스 및 비즈니스 인텔리전스 기술의 발전으로 인해 이제CIO들은 더 큰 비즈니스 데이터를 더 빠르고 저렴하면서 유연하게 활용할 수 있게 되었다.

최근의 트렌드는 애널리틱스 문제를 해결하는데 초점을 맞추고 있다. 많은 기관들이 수집한 데이터를 활용하기 위해 노력함에 따라 거대하고 다양한 데이터 세트를 관리하고 분석하기 위한 기술이 등장하고 있다. 고도화된 애널리틱스의 출현은 기업들이 이전보다 더욱 복잡한 질문을 던지고 기업을 운영하는데 더욱 도움이 되는 정보를 제공할 수 있음을 의미한다.

CIO들은 인터뷰에서 빅 데이터의 등장, 더욱 빠른 처리를 위한 기술, IT 상품의 비용 하락, 모바일 기기확산, 소셜 미디어의 확산 등 5가지의 공통된 IT 트렌드를 지적했다.

1. 빅 데이터
빅 데이터는 전통적인 데이터 저장소에 질서정연하게 정리하기 어려운 매우 거대한 데이터 세트를 의미한다. 웹 크롤러(Web Crawler) 데이터, 소셜 미디어 피드(Feed), 서버 로그뿐만이 아니라 공급망과 산업/환경/감시 센서로부터 얻은 모든 데이터 때문에 기업 데이터는 과거 어느 때보다도 더욱 복잡해지고 있다.

모든 기업이 거대하고 구조화되지 않은 데이터 세트를 처리하기 위한 기술을 필요로 하는 것은 아니지만 베리스크 어낼리틱스(Verisk Analytics)의 CIO 페리 로텔라는 모든 CIO가 빅 데이터 분석 툴에 관심을 가져야 한다고 주장하고 있다. 베리스크는 금융기관의 위험 평가와 보험회사들의 가짜 청구 데이터 규명을 돕는 기업으로의 2010년 10억 달러 매출을 기록했던 바 있다.

로텔라는 데이터는 많을수록 좋다는 자세로 압도적인 양의 데이터를 수용해야 한다며 "데이터 사이의 미리 알아낼 수 없는 패턴과 상관관계를 찾는" 업무도 수행해야 한다고 전했다.

빅 데이터는 "폭발적인" 트렌드라고 의료보장 프로그램뿐만이 아니라 사기업들을 위한 의료보장 비용을 억제하는데 도움을 주고 있는 HMS의 CIO 신시아 너스터드는 말했다. 참고로 이 기업은 40여 개 주의 의료 및 복지 서비스 프로그램과 130개 이상의 의료보장계획을 지원하고 있다. HMS 덕분에 상기 프로그램들은 2010년에 법률 소송에서 18억 달러 이상의 손실을 모면했고 잘못된 지출을 막아 수십억 달러를 절약할 수 있었다.

너스터드는 "우리는 구조화된 데이터와 구조화되지 않은 엄청난 데이터를 수집 및 추적하고 있다. 그러나 이것들로 우리가 무엇을 할 수 있는지 항상 알고 있는 것은 아니다"라고 말했다.

빅 데이터 기술과 관련하여 가장 많이 거론되는 용어는 하둡(Hadoop)이다. 이것은 본래 웹 검색 색인을 수집하기 위해서 개발된 분산형 데이터 처리 오픈 소스 플랫폼이다. 이것은 기발한 방식으로 웹 규모의 데이터 정리하기 위해 등장한 소위 말하는 ‘NoSQL’ 기술(코치DB(CouchDB)와 망고DB(MangoDB) 포함) 중 하나다.

하둡은 데이터를 수백 또는 수천 개의 서버에 할당하여 수 페타바이트의 데이터를 처리할 수 있게 한다. 각 서버는 마스터 작업 스케줄러가 대조할 수 있는 결과를 제공하게 된다. 하둡은 분석을 위한 데이터 준비에 사용되거나 그 자체로 데이터를 분석하는 툴로서 사용될 수 있다. 또한 수천 대에 이르는 여분의 서버를 보유하고 있지 못한 기업도 아마존 등의 클라우드 벤더로부터 하둡 인스턴스에 대한 주문형(On-demand) 접속 권한을 구매할 수 있다.

너스터드는 현재 NoSQL 기술의 활용을 검토하고 있다. 물론, 의료보장제도의 거대한 청구 데이터베이스를 위한 용도는 아니다. 그녀는 여기에는 구조화된 데이터가 포함되고 전통적인 데이터 저장 기술을 이용해 처리할 수 있다면서, 관계형 기술로 해결할 수 있는 문제를 처리할 때 전통적인 관계형 데이터베이스 관리를 외면하는 것은 비상식적이라고 말했다.

하지만 너스터드는 다양한 양상을 띨 수 있는 환자의 방문 기록을 분석하는 등 가짜 또는 낭비 분석에서 하둡이 제 역할을 할 수 있을 것으로 보고 있다.

실질적으로 하둡을 경험한 바 있는 로텔라와 숍질라(Shopzilla)의 CIO 조디 멀키는 "우리는 데이터 저장소와 같은 목적으로 하둡을 사용하고 있다"라며 더욱 중요한 것은 "이전에는 불가능했던 진정으로 흥미로운 분석을" 추구하는 것이라고 말했다.

예를 들어, 가격비교 사이트인 숍질라는 매일 수 테라바이트의 데이터를 수집하고 있다. 그는 "데이터의 표본을 채취하고 분할하기 전까지는 데이터의 규모 때문에 작업이 너무 방대했다"면서 숍질라가 하둡을 통해 원본 데이터를 분석하면서 그 사이의 과정을 생략할 수 있게 됐다고 전했다.

인디애나주 사우스웨스트의 지역 병원 굿 사마리탄(Good Samaritan) 병원의 상황은 좀 다르다. CIO 척 크리스찬은 "우리는 빅 데이터라고 할만한 것이 없다"라고 말했다. 그러나 그는 규제상의 요건 때문에 엄청난 양의 전자 의무기록 등 새로운 범주의 데이터를 저장해야 한다.

그는 이런 데이터로부터 의료서비스의 질에 관한 정보를 얻을 수 있는 상당한 잠재력이 있는 것은 사실이지만 그런 작업은 지역 또는 국립 의료기관에 더욱 적합하다고 말한다. 그가 획기적인 신기술에 투자할 가능성은 낮은 것이다.

아일랜드 원 리조트(Island One Resorts)의 CIO 존 터넌트는 플로리다에서 8곳의 공동 리조트를 관리하고 있는 회사를 위해 복잡한 담보 포트폴리오 분석을 운용하기 위한 경제적인 방법으로써 하둡 인스턴스를 클라우드에서 활용하는 방안을 심각하게 검토하고 있다. 그는 "우리가 현재 직면하고 있는 실제적인 문제에 대한 잠재적인 솔루션"라 말했다.  

2. 빨라지는 비즈니스 분석
빅 데이터 기술은 더 빠른 분석을 향한 트렌드를 구성하는 한 요소라고 켄터키 대학(University of Kentucky)의 CIO 빈스 켈렌은 평가했다. 그는 "우리가 진정으로 원하는 것은 엄청나게 많은 데이터에 관한 고도의 분석이다. 빠른 속도를 원하기 때문에" 얼마나 많은 데이터를 보유하고 있는가보다 얼마나 효율적으로 분석할 수 있느냐가 더욱 중요하다고 말했다.


X