Offcanvas

��������������������������������������������������������������������������������� ���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������

빅 데이터 구축과 활용 ‘사례 속의 교훈들’

제너럴 모터스(GM)의 원격 차량 진단 및 응급 상황 대응 서비스인 온스타(OnStar)는 연간 3페타바이트에 달하는 데이터를 관리한다. 온스타의 CIO 제프리 리델은 이들 데이터를 활용해 운전자들과 GM의 비즈니스에 효용을 가져다 줄 방법이 다양할 것으로 기대하고 있다. 한 예로 GM은 셰볼레 볼트 전기 자동차 운전자들이 모바일 애플리케이션으로 차량의 배터리를 확인하고 원격으로 관리할 수 있도록 하는 파일럿 테스트를 진행하고 있다. 닛산이나 포드와 같은 경쟁 기업들 역시 이와 유사한 전기 자동차 모니터링 기능을 제공하고 있거나, 도입을 계획 중이다. 전기 자동차를 이용하는 운전자들은 배터리 방전을 걱정하는 경향이 높은데, 제조업체들이 이러한 ‘주행거리 불안(range anxiety)’을 해소해주길 기대하고 있다. 하지만 고민은 이 뿐만이 아니다. 리델은, “전기 자동차 사용자들은, 자신들이 어딘가에 접속되어 있길 원한다. 그들은 자신들이 얼마나 운전을 잘 하고 있으며 어떠한 패턴으로 운전하고 있는지, 그리고 자신이 보유한 차량의 연료 효율은 어떠한지(볼트는 가솔린을 통해서도 운행이 가능하다) 등의 사항들에 대한 통계에 관심을 가지고 있다”라고 설명했다. 물론 온스타 데이터를 보다 깊이 이해하기를 원하는 집단이 전기 자동차 운전자들뿐인 것은 아니다. 내부 현업 사용자들과 외부의 파트너들 역시 이 정보를 원하고 있다. 리델은 이들에게 데이터를 안전하고 안정적으로, 그리고 탄력적으로 전달하는 것이 IT의 역할이라고 강조했다. 그는 “핵심은 데이터와 애널리틱스의 중요성을 인식하는 것이다. 때로 이들이 트랜잭션 시스템을 구동하는 중추적 요소는 아닐 수도 있다. 그러나 비즈니스를 운용하는데 있어서는, 이는 분명한 핵심 요소다”라고 설명했다.   물론 모든 CIO들이 페타바이트 단위의 데이터를 관리하지는 않을 것이다. 그러나 단순히 몇 기가바이트 단위의 소규모 데이터 ...

데이터 사례 애널리틱스 데이터 과학자 빅 데이터 접근 관리

2012.04.20

제너럴 모터스(GM)의 원격 차량 진단 및 응급 상황 대응 서비스인 온스타(OnStar)는 연간 3페타바이트에 달하는 데이터를 관리한다. 온스타의 CIO 제프리 리델은 이들 데이터를 활용해 운전자들과 GM의 비즈니스에 효용을 가져다 줄 방법이 다양할 것으로 기대하고 있다. 한 예로 GM은 셰볼레 볼트 전기 자동차 운전자들이 모바일 애플리케이션으로 차량의 배터리를 확인하고 원격으로 관리할 수 있도록 하는 파일럿 테스트를 진행하고 있다. 닛산이나 포드와 같은 경쟁 기업들 역시 이와 유사한 전기 자동차 모니터링 기능을 제공하고 있거나, 도입을 계획 중이다. 전기 자동차를 이용하는 운전자들은 배터리 방전을 걱정하는 경향이 높은데, 제조업체들이 이러한 ‘주행거리 불안(range anxiety)’을 해소해주길 기대하고 있다. 하지만 고민은 이 뿐만이 아니다. 리델은, “전기 자동차 사용자들은, 자신들이 어딘가에 접속되어 있길 원한다. 그들은 자신들이 얼마나 운전을 잘 하고 있으며 어떠한 패턴으로 운전하고 있는지, 그리고 자신이 보유한 차량의 연료 효율은 어떠한지(볼트는 가솔린을 통해서도 운행이 가능하다) 등의 사항들에 대한 통계에 관심을 가지고 있다”라고 설명했다. 물론 온스타 데이터를 보다 깊이 이해하기를 원하는 집단이 전기 자동차 운전자들뿐인 것은 아니다. 내부 현업 사용자들과 외부의 파트너들 역시 이 정보를 원하고 있다. 리델은 이들에게 데이터를 안전하고 안정적으로, 그리고 탄력적으로 전달하는 것이 IT의 역할이라고 강조했다. 그는 “핵심은 데이터와 애널리틱스의 중요성을 인식하는 것이다. 때로 이들이 트랜잭션 시스템을 구동하는 중추적 요소는 아닐 수도 있다. 그러나 비즈니스를 운용하는데 있어서는, 이는 분명한 핵심 요소다”라고 설명했다.   물론 모든 CIO들이 페타바이트 단위의 데이터를 관리하지는 않을 것이다. 그러나 단순히 몇 기가바이트 단위의 소규모 데이터 ...

2012.04.20

하둡을 활용해 스토리지의 한계를 극복하는 방법

스토리지 기술은 발전하고 성숙해 많은 데이터센터에서 상품의 단계에 접근하는 수준에까지 이르렀다. 그럼에도 불구하고 기업들은 BI 역량을 더욱 거대한 데이터 셋에 적용하는 빅 데이터 분석에 대한 압박 등 스토리지 기술의 한계에 직면할 수 있는 상황에 처해 있다.   하지만 빅 데이터의 분석 과정은 일반적으로 기존의 스토리지 패러다임을 넘어서는 역량을 필요로 한다. 쉽게 말해 SANs와 NAS 등의 전통적인 스토리지 기술은 기본적으로 구조화되지 않은 테라바이트와 페타바이트 수준의 정보를 처리할 수 없다는 뜻이다.   성공적인 빅 데이터 분석을 위해서는 대규모의 데이터를 처리할 수 있는 새로운 방법 등이 필요하다. 즉, 새로운 스토리지 플랫폼의 이데올로기가 필요하게 된 것이다.   하둡에 관심을 가져보자 빅 데이터를 처리할 수 있는 플랫폼을 제공하는 오픈 소스 프로젝트 하둡으로 들어가보자. 비록 하둡이 개발된 지는 시간이 꽤 흘렀지만 점차 많은 기업들이 이제 막 그 기능을 활용하기 시작했다.   하둡 플랫폼은 막대한 용량의 데이터 가운데서도 복잡하고 구조화되지 않았거나 구조화된 정보를 복합적으로 포함하고 있어 테이블에 적절히 배치되지 않는 데이터에 의해 발생하는 문제를 해결하도록 설계됐다. 하둡은 클러스터링과 타겟팅처럼 심오하고 계산적으로 대규모인 분석의 지원을 필요로 하는 상황에 적합하다.   그렇다면 빅 데이터를 활용하려는 IT 전문가에게 하둡은 어떤 의미를 가질까? 간단히 말하면 하둡은 막대한 용량의 데이터를 효율적으로 저장하고 접근함으로써 빅 데이터와 관련된 대부분의 보편적인 문제를 해결한다.   하둡의 고유한 디자인 덕분에 메모리 또는 디스크를 전혀 공유하지 않는 다수의 기기에서 작동할 수 있는 플랫폼을 운용할 수 있다. 이를 염두에 두면 하둡이 어떻게 추가적인 가치를 제공하는지 쉽게 알 수 있다. ...

ETL 하둡 빅 데이터 맵 리듀스

2012.04.20

스토리지 기술은 발전하고 성숙해 많은 데이터센터에서 상품의 단계에 접근하는 수준에까지 이르렀다. 그럼에도 불구하고 기업들은 BI 역량을 더욱 거대한 데이터 셋에 적용하는 빅 데이터 분석에 대한 압박 등 스토리지 기술의 한계에 직면할 수 있는 상황에 처해 있다.   하지만 빅 데이터의 분석 과정은 일반적으로 기존의 스토리지 패러다임을 넘어서는 역량을 필요로 한다. 쉽게 말해 SANs와 NAS 등의 전통적인 스토리지 기술은 기본적으로 구조화되지 않은 테라바이트와 페타바이트 수준의 정보를 처리할 수 없다는 뜻이다.   성공적인 빅 데이터 분석을 위해서는 대규모의 데이터를 처리할 수 있는 새로운 방법 등이 필요하다. 즉, 새로운 스토리지 플랫폼의 이데올로기가 필요하게 된 것이다.   하둡에 관심을 가져보자 빅 데이터를 처리할 수 있는 플랫폼을 제공하는 오픈 소스 프로젝트 하둡으로 들어가보자. 비록 하둡이 개발된 지는 시간이 꽤 흘렀지만 점차 많은 기업들이 이제 막 그 기능을 활용하기 시작했다.   하둡 플랫폼은 막대한 용량의 데이터 가운데서도 복잡하고 구조화되지 않았거나 구조화된 정보를 복합적으로 포함하고 있어 테이블에 적절히 배치되지 않는 데이터에 의해 발생하는 문제를 해결하도록 설계됐다. 하둡은 클러스터링과 타겟팅처럼 심오하고 계산적으로 대규모인 분석의 지원을 필요로 하는 상황에 적합하다.   그렇다면 빅 데이터를 활용하려는 IT 전문가에게 하둡은 어떤 의미를 가질까? 간단히 말하면 하둡은 막대한 용량의 데이터를 효율적으로 저장하고 접근함으로써 빅 데이터와 관련된 대부분의 보편적인 문제를 해결한다.   하둡의 고유한 디자인 덕분에 메모리 또는 디스크를 전혀 공유하지 않는 다수의 기기에서 작동할 수 있는 플랫폼을 운용할 수 있다. 이를 염두에 두면 하둡이 어떻게 추가적인 가치를 제공하는지 쉽게 알 수 있다. ...

2012.04.20

'빅 데이터, 중소 기업·소비자도 활용' 인튜이트의 선물

빅 데이터라는 용어와 관련해 ‘퀵북스’(QuickBooks)나 ‘터보택스’(TurboTax) 등의 제품들이 연상되지는 않을 것이다. 그러나 인튜이트의 ‘Big Data for the Little Guy’ 이니셔티브는 중소기업이나 개인들도 인튜이트가 수집한 데이터에 대해 쿼리를 만들 수 있도록 해준다. 많은 사람들이 빅데이터(Big Dat)라는 단어와 함께 구글과 페이스북을 떠올리곤 한다. 전체 사업이 방대한 데이터에 좌지우지되는 인터넷 기업들이기 때문이다. 그러나 이들 외에도 방대한 정보를 다루면서, 데이터 기반의 변화를 추구하고 있는 회사들이 많이 있다. 회계 및 재무관리 소프트웨어인 퀵북(QuickBook), 퀵켄(Quicken), 터보택스(TurboTax)를 개발해 판매하고 있는 인튜이트(Intuit)도 이런 회사 가운데 하나다. 인튜이트(http://www.intuit.com)는 중소기업, 은행이나 신용카드 같은 금융기관, 일반 소비자, 회계직 종사자를 대상으로 비즈니스 및 재무 관리 솔루션을 공급하고 있다. 그리고 데이터를 공유하기로 허락한 사용자들의 데이터를 방대하게 보유하고 있다. 구체적으로는 트랜젝션 데이터, (터보 택스 온라인과 민트 같은 제품에서 나온) 행동 데이터, 사용자 생성 데이터, 심지어는 소셜 네트워크와 트위터에 기반한 소셜 데이터를 보유하고 있다. 인튜이트는 또 개인이나 기업이 자신들의 데이터에 쿼리를 생성할 수 있는, 이른바 '중소기업과 개인을 위한 빅데이터(Big Data for the Little Guy)'라는 계획을 통해 빅 데이터를 대중화하려 하고 있다. 인튜이트의 빅데이터 및 소셜 설계 부문 노라 덴젤 수석 부사장은 "시간과 비용을 절감하면서도 데이터를 이용, 분석할 수 있도록 하고자 한다. 다른 방식으로는 불가능한 목표다"라고 말했다. 덴젤은 이 데이터를 사용해 자신이 이...

빅 데이터 인튜이트 퀵북스 터보택스

2012.04.09

빅 데이터라는 용어와 관련해 ‘퀵북스’(QuickBooks)나 ‘터보택스’(TurboTax) 등의 제품들이 연상되지는 않을 것이다. 그러나 인튜이트의 ‘Big Data for the Little Guy’ 이니셔티브는 중소기업이나 개인들도 인튜이트가 수집한 데이터에 대해 쿼리를 만들 수 있도록 해준다. 많은 사람들이 빅데이터(Big Dat)라는 단어와 함께 구글과 페이스북을 떠올리곤 한다. 전체 사업이 방대한 데이터에 좌지우지되는 인터넷 기업들이기 때문이다. 그러나 이들 외에도 방대한 정보를 다루면서, 데이터 기반의 변화를 추구하고 있는 회사들이 많이 있다. 회계 및 재무관리 소프트웨어인 퀵북(QuickBook), 퀵켄(Quicken), 터보택스(TurboTax)를 개발해 판매하고 있는 인튜이트(Intuit)도 이런 회사 가운데 하나다. 인튜이트(http://www.intuit.com)는 중소기업, 은행이나 신용카드 같은 금융기관, 일반 소비자, 회계직 종사자를 대상으로 비즈니스 및 재무 관리 솔루션을 공급하고 있다. 그리고 데이터를 공유하기로 허락한 사용자들의 데이터를 방대하게 보유하고 있다. 구체적으로는 트랜젝션 데이터, (터보 택스 온라인과 민트 같은 제품에서 나온) 행동 데이터, 사용자 생성 데이터, 심지어는 소셜 네트워크와 트위터에 기반한 소셜 데이터를 보유하고 있다. 인튜이트는 또 개인이나 기업이 자신들의 데이터에 쿼리를 생성할 수 있는, 이른바 '중소기업과 개인을 위한 빅데이터(Big Data for the Little Guy)'라는 계획을 통해 빅 데이터를 대중화하려 하고 있다. 인튜이트의 빅데이터 및 소셜 설계 부문 노라 덴젤 수석 부사장은 "시간과 비용을 절감하면서도 데이터를 이용, 분석할 수 있도록 하고자 한다. 다른 방식으로는 불가능한 목표다"라고 말했다. 덴젤은 이 데이터를 사용해 자신이 이...

2012.04.09

한국오라클, 가시적 분석 가능한 ‘엑사리틱스’ 발표

한국오라클이 인메모리 BI 소프트웨어와 하드웨어가 결합된 ‘오라클 엑사리틱스 인메모리 머신(Oracle Exalytics In-Memory Machine)’을 발표했다. 한국오라클은 엑사리틱스가 분석업무에 특화된 BI를 제공하는 엔지니어드 시스템으로 고성능 실시간 분석 및 경영관리 역량을 필요로 하는 기업을 지원할 것으로 기대하고 있다.   이 제품은 오라클 BI 파운데이션 스위트와 엑사리틱스를 위한 오라클 타임스텐 인메모리 DB(Oracle TimesTen In-Memory Database for Exalytics), 인메모리 분석을 위해 설계된 오라클 서버가 결합됐다. 엑사리틱스는 신속하게 구축하고 대용량 데이터를 ‘생각의 속도’만큼 즉각적 반응 속도로 분석해 주며 TCO를 절감시킨다. 또한, 80개 이상의 오라클 BI 및 기업성과관리(EPM) 애플리케이션을 변경하지 않고 활용할 수 있으며, 아이폰, 아이패드 등의 모바일 기기를 지원해 수 천명의 사용자가 동시에 상호작용할 수 있다. 게다가 IBM, SAP, 마이크로소프트 등 이기종 시스템의 데이터도 끌어와 분석할 수 있다. 한국오라클은 비정형 데이터 분석 솔루션인 ‘엔데카(Endeca)’의 영업도 본격적으로 나설 예정이다. 기업은 엔데카를 통해 비정형 데이터를 정교하고 빠르게 분석하고 신속하게 의사 결정을 내림으로써 고객들이 원하는 최적의 정보를 제공할 수 있으며 온라인, 매장, 모바일, SNS 등 다양한 채널에서 일관된 경험을 지원할 수 있다. 엑사리틱스는 오라클의 DB머신인 엑사데이터, 미들웨어 머신인 엑사로직에 이은 세번째 ‘엑사 시리즈’다. 최근 벤치마크 테스트에서는 관계형 온라인 분석 처리(ROLAP) 리포팅과 대시보드 성능에서 최고 100배, 다차원 온라인 분석 처리(MOLAP) 모델링 성능에서 최고 79배의 성능 향상을 기록한 바 있으며, 자유자재의 시각화(unlimited vi...

SAP 오라클 인메모리 분석 빅 데이터 엑사리틱스

2012.04.05

한국오라클이 인메모리 BI 소프트웨어와 하드웨어가 결합된 ‘오라클 엑사리틱스 인메모리 머신(Oracle Exalytics In-Memory Machine)’을 발표했다. 한국오라클은 엑사리틱스가 분석업무에 특화된 BI를 제공하는 엔지니어드 시스템으로 고성능 실시간 분석 및 경영관리 역량을 필요로 하는 기업을 지원할 것으로 기대하고 있다.   이 제품은 오라클 BI 파운데이션 스위트와 엑사리틱스를 위한 오라클 타임스텐 인메모리 DB(Oracle TimesTen In-Memory Database for Exalytics), 인메모리 분석을 위해 설계된 오라클 서버가 결합됐다. 엑사리틱스는 신속하게 구축하고 대용량 데이터를 ‘생각의 속도’만큼 즉각적 반응 속도로 분석해 주며 TCO를 절감시킨다. 또한, 80개 이상의 오라클 BI 및 기업성과관리(EPM) 애플리케이션을 변경하지 않고 활용할 수 있으며, 아이폰, 아이패드 등의 모바일 기기를 지원해 수 천명의 사용자가 동시에 상호작용할 수 있다. 게다가 IBM, SAP, 마이크로소프트 등 이기종 시스템의 데이터도 끌어와 분석할 수 있다. 한국오라클은 비정형 데이터 분석 솔루션인 ‘엔데카(Endeca)’의 영업도 본격적으로 나설 예정이다. 기업은 엔데카를 통해 비정형 데이터를 정교하고 빠르게 분석하고 신속하게 의사 결정을 내림으로써 고객들이 원하는 최적의 정보를 제공할 수 있으며 온라인, 매장, 모바일, SNS 등 다양한 채널에서 일관된 경험을 지원할 수 있다. 엑사리틱스는 오라클의 DB머신인 엑사데이터, 미들웨어 머신인 엑사로직에 이은 세번째 ‘엑사 시리즈’다. 최근 벤치마크 테스트에서는 관계형 온라인 분석 처리(ROLAP) 리포팅과 대시보드 성능에서 최고 100배, 다차원 온라인 분석 처리(MOLAP) 모델링 성능에서 최고 79배의 성능 향상을 기록한 바 있으며, 자유자재의 시각화(unlimited vi...

2012.04.05

아모레퍼시픽, 빅 데이터에서 고객의 속마음을 꿰뚫어 개인 맞춤 서비스 제안 - IDG Case Study

국내 미용 업계 1위인 아모레퍼시픽의 평생 고객 캠페인은 빅 데이터를 기반으로 한다. 아모레퍼시픽은 고객의 구매 정보부터 피부 진단 결과, 콜센터 불만, 페이스북 댓글에 이르는 모든 데이터를 통합하고, 신속한 분석을 위해 데이터를 70% 압축해 처리 속도를 최대 500배 향상시켜 최적의 환경을 구축했다. 국내를 넘어 글로벌 선두 기업들도 주목하는 이 회사의 평생 고객 캠페인의 핵심은 상품이 아니라 고객 개개인을 중심으로 접근했다는 점이다.   주요 내용 미션 ‘숨은 고객 정보를 찾아라!’ SNS•콜센터 정보까지 담은 빅 데이터 대용량을 신속하게 처리할 수 있는 네티자 선택 글로벌 업계도 주시하는 ‘고객 분석기술’

분석 유통 DW어플라이언스 아모레퍼시픽 네티자 빅 데이터 소비재

2012.04.04

국내 미용 업계 1위인 아모레퍼시픽의 평생 고객 캠페인은 빅 데이터를 기반으로 한다. 아모레퍼시픽은 고객의 구매 정보부터 피부 진단 결과, 콜센터 불만, 페이스북 댓글에 이르는 모든 데이터를 통합하고, 신속한 분석을 위해 데이터를 70% 압축해 처리 속도를 최대 500배 향상시켜 최적의 환경을 구축했다. 국내를 넘어 글로벌 선두 기업들도 주목하는 이 회사의 평생 고객 캠페인의 핵심은 상품이 아니라 고객 개개인을 중심으로 접근했다는 점이다.   주요 내용 미션 ‘숨은 고객 정보를 찾아라!’ SNS•콜센터 정보까지 담은 빅 데이터 대용량을 신속하게 처리할 수 있는 네티자 선택 글로벌 업계도 주시하는 ‘고객 분석기술’

2012.04.04

'빅 데이터 및 클라우드 전문가 양성' 시스코·EMC·VM웨어 공조키로

IT 사일로가 축소되는 가운데, IT 전문가들은 새로운 기술과 지식 습득을 요구받고 있다. 특히 비즈니스와 관련이 높은 클라우드 컴퓨팅, 가상화, 통합 네트워킹, 빅 데이터와 같은 분야에서 그렇다. 시스코와 EMC는 공동으로 이들 분야에 대한 훈련 과정을 개발하기로 합의했다. 이들 기업은 IT 아키텍처의 변호로 인해 새로운 역할이 대두되고 있다면서 기업들은 기존 IT 인력이 새로운 역할을 다룰 수 있도록 대비해야 할 필요가 있다고 밝혔다. 시스코의 학습 서비스 디렉터 앤쏘니 브라이언트는 "전통적인 데이터 센터에서 가상 데이터 센터로, 클라우드 기반의 데이터 센터로 어떻게 이전해야 할까? 그리고 기술 인력은 또 어떻게 전화해야 할까? 이에 대한 혼란이 있는 상태다"라고 말했다.   양사가 이번 주 공개한 훈련 이니셔티브에는 VM웨어의 리소스도 포함돼 있다. 이들 기업은 클라우드 아키텍처, 가상화, 스토리지, 데이터 센터 네트워킹 및 데이터 사이언스 등에 대한 교육 과정과 인증을 서비스할 예정이다. EMC의 교육 서비스 부문 선임 디렉터 알록 슈리바트타바는 "서비스로서의 IT, 클라우드 기반 데이터 센터 환경 등으로 인해 전통적인 IT 사일로와 지주의 경계가 희미해짔고 있다"라며, "시스템 관리자, DBA, 네트워크 관리자들도 다른 기술 분야에 대해 이해해야만 한다"라고 말했다. 그는 이어 시스코/EMC/VM웨어의 이번 교육 과정은 여러 분야에 대한 이해를 습득하도록 구성돼 있다고 서명했다. 예를 들어 시스템 관리자 과정은, 클라우드 인프라스트럭처 및 서비스, VM웨어 V스피어(설치, 구성, 관리), DCUCI(Cisco Data Center Unified Computing Implementation) 등의 코스를 필요로 한다. 데이터 센터 네트워크 아키텍트 과정은 EMC 클라우드 인프라 스트럭처 및 서비스, DCUFD(Cisco Data Center Unified Fabri...

가상화 클라우드 CIO 교육 인력 훈련 빅 데이터

2012.04.04

IT 사일로가 축소되는 가운데, IT 전문가들은 새로운 기술과 지식 습득을 요구받고 있다. 특히 비즈니스와 관련이 높은 클라우드 컴퓨팅, 가상화, 통합 네트워킹, 빅 데이터와 같은 분야에서 그렇다. 시스코와 EMC는 공동으로 이들 분야에 대한 훈련 과정을 개발하기로 합의했다. 이들 기업은 IT 아키텍처의 변호로 인해 새로운 역할이 대두되고 있다면서 기업들은 기존 IT 인력이 새로운 역할을 다룰 수 있도록 대비해야 할 필요가 있다고 밝혔다. 시스코의 학습 서비스 디렉터 앤쏘니 브라이언트는 "전통적인 데이터 센터에서 가상 데이터 센터로, 클라우드 기반의 데이터 센터로 어떻게 이전해야 할까? 그리고 기술 인력은 또 어떻게 전화해야 할까? 이에 대한 혼란이 있는 상태다"라고 말했다.   양사가 이번 주 공개한 훈련 이니셔티브에는 VM웨어의 리소스도 포함돼 있다. 이들 기업은 클라우드 아키텍처, 가상화, 스토리지, 데이터 센터 네트워킹 및 데이터 사이언스 등에 대한 교육 과정과 인증을 서비스할 예정이다. EMC의 교육 서비스 부문 선임 디렉터 알록 슈리바트타바는 "서비스로서의 IT, 클라우드 기반 데이터 센터 환경 등으로 인해 전통적인 IT 사일로와 지주의 경계가 희미해짔고 있다"라며, "시스템 관리자, DBA, 네트워크 관리자들도 다른 기술 분야에 대해 이해해야만 한다"라고 말했다. 그는 이어 시스코/EMC/VM웨어의 이번 교육 과정은 여러 분야에 대한 이해를 습득하도록 구성돼 있다고 서명했다. 예를 들어 시스템 관리자 과정은, 클라우드 인프라스트럭처 및 서비스, VM웨어 V스피어(설치, 구성, 관리), DCUCI(Cisco Data Center Unified Computing Implementation) 등의 코스를 필요로 한다. 데이터 센터 네트워크 아키텍트 과정은 EMC 클라우드 인프라 스트럭처 및 서비스, DCUFD(Cisco Data Center Unified Fabri...

2012.04.04

SAS, 하둡 전격 지원 발표

SAS코리아는 최근 업그레이드한 SAS 데이터통합서버를 통해 오픈소스 프레임워크인 하둡(Hadoop)을 전격 지원한다고 밝혔다. 회사 측은 이제 사용자들이 범용 오픈소스 데이터 환경에서도 SAS 비즈니스 분석(Business Analytics) 제품들을 활용해 빅 데이터 자산의 가치를 증대시킬 수 있다고 설명했다. 현재 아파치(Apache) 소프트웨어재단이 후원하는 하둡은 분산 컴퓨팅 환경에서 대량의 데이터를 처리하기 위한 자바(JAVA) 기반의 오픈소스 프레임워크다. SAS는 하둡과의 통합 완성도를 높이기 위해 분산 컴퓨팅 구조인 맵리듀스(MapReduce)의 병렬 처리 방식을 적용하고, 이를 통해 일반적인 빅 데이터 분석과 분석 활용 가상 시나리오 작업 등이 간소화될 것이라고 설명했다. SAS코리아 조성식 대표는 “하둡의 가치와 활용도를 높이 평가하고 도입을 확대하려는 기업들이 늘어나면서 그 중요성이 점점 커지고 있다”면서, “SAS의 애널리틱스와 하둡이 통합되면 분산 처리 능력의 이점을 활용할 수 있을 뿐만 아니라 하둡 환경을 효과적으로 관리할 수 있다”고 말했다. 이어, “하둡은 복잡한 구조의 배치를 개발, 관리할 수 있는 툴이 부족한 편"이라며, "SAS 소프트웨어가 최소한의 리소스로 하둡의 진정한 가치를 극대화시켜 줄 수 있을 것”이라고 자신했다. ciokr@idg.co.kr

SAS 하둡 빅 데이터 분석 기술

2012.04.02

SAS코리아는 최근 업그레이드한 SAS 데이터통합서버를 통해 오픈소스 프레임워크인 하둡(Hadoop)을 전격 지원한다고 밝혔다. 회사 측은 이제 사용자들이 범용 오픈소스 데이터 환경에서도 SAS 비즈니스 분석(Business Analytics) 제품들을 활용해 빅 데이터 자산의 가치를 증대시킬 수 있다고 설명했다. 현재 아파치(Apache) 소프트웨어재단이 후원하는 하둡은 분산 컴퓨팅 환경에서 대량의 데이터를 처리하기 위한 자바(JAVA) 기반의 오픈소스 프레임워크다. SAS는 하둡과의 통합 완성도를 높이기 위해 분산 컴퓨팅 구조인 맵리듀스(MapReduce)의 병렬 처리 방식을 적용하고, 이를 통해 일반적인 빅 데이터 분석과 분석 활용 가상 시나리오 작업 등이 간소화될 것이라고 설명했다. SAS코리아 조성식 대표는 “하둡의 가치와 활용도를 높이 평가하고 도입을 확대하려는 기업들이 늘어나면서 그 중요성이 점점 커지고 있다”면서, “SAS의 애널리틱스와 하둡이 통합되면 분산 처리 능력의 이점을 활용할 수 있을 뿐만 아니라 하둡 환경을 효과적으로 관리할 수 있다”고 말했다. 이어, “하둡은 복잡한 구조의 배치를 개발, 관리할 수 있는 툴이 부족한 편"이라며, "SAS 소프트웨어가 최소한의 리소스로 하둡의 진정한 가치를 극대화시켜 줄 수 있을 것”이라고 자신했다. ciokr@idg.co.kr

2012.04.02

아마존, 클라우드에 1,700명의 유전자 정보 저장

아마존 웹 서비스가 1,700명의 유전자 정보를 자사 퍼블릭 클라우드에 저장했고 전세계 누구라도 여기에 접근할 수 있다고 밝혔다. 200TB 데이터는 미국 국립보건원(National Institutes of Health)과 75개 기업 및 기관들과 파트너십을 맺어 공동으로 진행하는 1000 게놈 프로젝트의 일환으로 확보된 것이다. 이 프로젝트의 목표는 과학 연구를 위해 최종적으로 전세계에서 2,662명의 유전자 정보를 저장하는 것이다. 특히 연구진들은 질병 연구하기 위해 표본을 통해 1% 이상의 빈도를 나타내는 유전적 다양성을 찾고 있다. AWS로 게놈 정보를 넣으면 AWS의 서버에 저장되며 이는 전세계에서 활용할 수 있는 가장 거대한 인간 유전자의 집합이 될 것이라고 아마존은 전했다. 현재 AWS는 데이터 저장과 접근을 무료로 제공하지만, 데이터를 분석하기 위해 필요한 추가 컴퓨팅 파워를 사용하는 데는 비용을 부과하고 있다. AWS는 사용자가 AWS의 엘라스틱 컴퓨트 클라우드(EC2)나 엘라스틱 맵리듀스 컴퓨팅 서비스에서 실행하는 하둡을 이용할 수 있다고 밝혔다. 엘라스틱 맵리듀스 컴퓨팅 서비스는 심플 스토리지 서비스(S3)에 저장된 데이터를 분석해 준다. 1,700개 이상의 게놈 데이터세트의 대부분은 익명의 개인들에게 취합했다. 1만 게놈 프로젝트는 참가자들의 개인 정보에 대한 동의를 구하는 윤리 기준을 준수해 진행됐다. 이 프로젝트는 이미 전세계 곳곳에서 인구 표본에서 데이터를 취합했다. 북동유럽에서 조상들이 미국으로 이주하고 현재 유타 주에 거주하는 사람들, 덴버에 사는 중국계, 로스앤젤레스에 사는 멕시코계, 미국 남서부에 사는 아프리카계 등의 게놈 정보를 담았다. AWS는 백악관에서 열린 빅 데이터 서밋에서 이러한 내용들을 발표했다. 빅 데이터 서밋에서 정부와 연구원들은 빅 데이터가 가져올 도전과 기회를 논의했다. ciokr@idg.co.kr

클라우드 아마존 AWS 빅 데이터 유전자 정보 게놈 프로젝트 질병 연구

2012.03.30

아마존 웹 서비스가 1,700명의 유전자 정보를 자사 퍼블릭 클라우드에 저장했고 전세계 누구라도 여기에 접근할 수 있다고 밝혔다. 200TB 데이터는 미국 국립보건원(National Institutes of Health)과 75개 기업 및 기관들과 파트너십을 맺어 공동으로 진행하는 1000 게놈 프로젝트의 일환으로 확보된 것이다. 이 프로젝트의 목표는 과학 연구를 위해 최종적으로 전세계에서 2,662명의 유전자 정보를 저장하는 것이다. 특히 연구진들은 질병 연구하기 위해 표본을 통해 1% 이상의 빈도를 나타내는 유전적 다양성을 찾고 있다. AWS로 게놈 정보를 넣으면 AWS의 서버에 저장되며 이는 전세계에서 활용할 수 있는 가장 거대한 인간 유전자의 집합이 될 것이라고 아마존은 전했다. 현재 AWS는 데이터 저장과 접근을 무료로 제공하지만, 데이터를 분석하기 위해 필요한 추가 컴퓨팅 파워를 사용하는 데는 비용을 부과하고 있다. AWS는 사용자가 AWS의 엘라스틱 컴퓨트 클라우드(EC2)나 엘라스틱 맵리듀스 컴퓨팅 서비스에서 실행하는 하둡을 이용할 수 있다고 밝혔다. 엘라스틱 맵리듀스 컴퓨팅 서비스는 심플 스토리지 서비스(S3)에 저장된 데이터를 분석해 준다. 1,700개 이상의 게놈 데이터세트의 대부분은 익명의 개인들에게 취합했다. 1만 게놈 프로젝트는 참가자들의 개인 정보에 대한 동의를 구하는 윤리 기준을 준수해 진행됐다. 이 프로젝트는 이미 전세계 곳곳에서 인구 표본에서 데이터를 취합했다. 북동유럽에서 조상들이 미국으로 이주하고 현재 유타 주에 거주하는 사람들, 덴버에 사는 중국계, 로스앤젤레스에 사는 멕시코계, 미국 남서부에 사는 아프리카계 등의 게놈 정보를 담았다. AWS는 백악관에서 열린 빅 데이터 서밋에서 이러한 내용들을 발표했다. 빅 데이터 서밋에서 정부와 연구원들은 빅 데이터가 가져올 도전과 기회를 논의했다. ciokr@idg.co.kr

2012.03.30

미 백악관, 국가차원의 빅 데이터 R&D 추진안 발표

미 정부 산하 6개 기관이 대용량 디지털 데이터 저장 및 분석과 관련해 총 2억 달러를 투자한다. 버락 오바마 미 대통령 행정부는 이 같은 내용을 담은 ‘빅 데이터’ 연구 및 개발 계획에 대해 지난 29일 발표했다. 백악관 OSTP(Office of Science and Technology Policy)의 이번 빅 데이터 연구 및 개발 이니셔티브는, 방대한 데이터를 수집하고 저장하며 관리하는 기술 개발에 초점을 맞출 예정이다. 백악관 발표에 따르면 OSTP는 이 기술을 통해 과학 및 엔지니어링 분야의 발견을 촉진하는 한편 국가 안보 및 교육을 증진시킬 수 있기를 기대하고 있다. 이번 계획에는 DARPA(Defense Advanced Research Projects Agency)의 투자도 포함돼 있다. DARPA는 텍스트 문서나 메시지 트랙픽 등의 비구조화된 데이터를 분석하는 방안하는데 연간 2,500만 달러를 투자할 예정이다. OSTP의 디렉터 존 홀드렌은 “연방 정부의 IT R&D는 수퍼컴퓨팅, 인터넷의 등장과 같은 극적인 진보를 생성해왔다. 오늘 출범하는 빅 데이터 이니셔티브 또한 인류의 능력을 진일보시키게 될 것이다. 과학적 발견, 환경 및 생물의학적 연구, 교육, 국가 안보와 관련해 빅 데이터의 활용 능력을 전환시킬 것”이라고 말했다. 빅 데이터는 이미 IT 업계에서 화두로 대두됐다. 미 정부는 또 방대한 양의 디지털 데이터를 이미 보유하고 있다. OSTP의 정책 보좌관 톰 카릴은 블로그 포스트를 통해 몇몇 대학과 비공개 기업이 이번 연구에 공조할 것이라고 밝혔다. 그는 “정부 홀로 진행할 수는 없다. 대통령이 ‘다함께’('all hands on deck) 노력할 필요가 있다고 표현한 것도 이 같은 맥락이라고 전했다. 그는 이어 몇몇 기업이 이미 후원하고 있으며 대학들 또한 데이터 과학자 양성을 위해 과정을 신설하고 있다고 덧붙였다....

오바마 정부 빅 데이터 백악관

2012.03.30

미 정부 산하 6개 기관이 대용량 디지털 데이터 저장 및 분석과 관련해 총 2억 달러를 투자한다. 버락 오바마 미 대통령 행정부는 이 같은 내용을 담은 ‘빅 데이터’ 연구 및 개발 계획에 대해 지난 29일 발표했다. 백악관 OSTP(Office of Science and Technology Policy)의 이번 빅 데이터 연구 및 개발 이니셔티브는, 방대한 데이터를 수집하고 저장하며 관리하는 기술 개발에 초점을 맞출 예정이다. 백악관 발표에 따르면 OSTP는 이 기술을 통해 과학 및 엔지니어링 분야의 발견을 촉진하는 한편 국가 안보 및 교육을 증진시킬 수 있기를 기대하고 있다. 이번 계획에는 DARPA(Defense Advanced Research Projects Agency)의 투자도 포함돼 있다. DARPA는 텍스트 문서나 메시지 트랙픽 등의 비구조화된 데이터를 분석하는 방안하는데 연간 2,500만 달러를 투자할 예정이다. OSTP의 디렉터 존 홀드렌은 “연방 정부의 IT R&D는 수퍼컴퓨팅, 인터넷의 등장과 같은 극적인 진보를 생성해왔다. 오늘 출범하는 빅 데이터 이니셔티브 또한 인류의 능력을 진일보시키게 될 것이다. 과학적 발견, 환경 및 생물의학적 연구, 교육, 국가 안보와 관련해 빅 데이터의 활용 능력을 전환시킬 것”이라고 말했다. 빅 데이터는 이미 IT 업계에서 화두로 대두됐다. 미 정부는 또 방대한 양의 디지털 데이터를 이미 보유하고 있다. OSTP의 정책 보좌관 톰 카릴은 블로그 포스트를 통해 몇몇 대학과 비공개 기업이 이번 연구에 공조할 것이라고 밝혔다. 그는 “정부 홀로 진행할 수는 없다. 대통령이 ‘다함께’('all hands on deck) 노력할 필요가 있다고 표현한 것도 이 같은 맥락이라고 전했다. 그는 이어 몇몇 기업이 이미 후원하고 있으며 대학들 또한 데이터 과학자 양성을 위해 과정을 신설하고 있다고 덧붙였다....

2012.03.30

“애널리틱스 인재 태부족” 몇몇 CIO들의 극복방안

기업 의사 결정에 있어서 상황 보고서만으로는 충분하지 않다. 경영자들은 현재의 미래의 트렌드를 읽기 위해 비즈니스 인텔리전스를 원하고 있다. IT 직원들은 데이터 웨어하우스를 운영하거나 대시보드를 구축하는 것 이상의 BI 관련 지식을 쌓아야 한다. 데이터 분석 기술 부족에 관해 경종을 울리고 있는 업계 전문가들은 이로 인해 CIO들이 곤경에 처하고 있다고 평가하고 있다. 예를 들어 지난 봄 맥킨지 글로벌 인스티튜트(McKinsey Global Institute)가 공개한 보고서에 따르면 2018년까지 미국 내에서만 분석 기술을 가진 인력이 14만 ~ 19만 명 정도 부족할 것으로 예상되며 대규모 데이터 세트의 분석을 활용해 효과적인 결정을 내릴 수 있는 방법을 알고 있는 관리자와 분석가는 약 150만 명 정도가 부족할 것으로 예상된다. "우리는 BI 리더의 등장으로 인해 순수한 상황 보고서가 아닌 진정한 추정 분석이 이루어질 것으로 본다"라고 50억 달러 규모의 생명공학 기업 바이오젠 아이덱(Biogen Idec)의 국제 IT 담당 부사장 그레그 메이어스는 말하며 "이는 기술적인 동시에 변화 관리와 관련한 문제다"라고 말했다. 포레스터 리서치 애널리스트 보리스 에벨슨은 지속적인 실업률 문제에도 불구하고 BI 인재 부족이 존재한다며, "대화를 나눈 모든 클라이언트는 BI 인재를 확보하고 보유하는데 어려움을 토로했다"라고 전했다. 그 공백을 메우기 위해 CIO들은 탄탄한 수학 능력과 거대한 데이터베이스 및 새로운 데이터베이스 기술을 능숙하게 다룰 수 있는 능력, 그리고 검색, 데이터 통합, 비즈니스 지식 등의 영역에 관련된 전문지식을 보유한 인력을 확보하기 위해 경쟁하고 있다. 에벨슨은 사실 프로세스, 고객, 제품 등을 이해하는 비즈니스 지식이 "기술 능력만큼이나 중요하다"라고 평가했다. 현재 IT 리더들는 지금 현재 필요한 분석 인재를 어떻게 확보...

BI 인력 애널리틱스 구인 빅 데이터

2012.03.29

기업 의사 결정에 있어서 상황 보고서만으로는 충분하지 않다. 경영자들은 현재의 미래의 트렌드를 읽기 위해 비즈니스 인텔리전스를 원하고 있다. IT 직원들은 데이터 웨어하우스를 운영하거나 대시보드를 구축하는 것 이상의 BI 관련 지식을 쌓아야 한다. 데이터 분석 기술 부족에 관해 경종을 울리고 있는 업계 전문가들은 이로 인해 CIO들이 곤경에 처하고 있다고 평가하고 있다. 예를 들어 지난 봄 맥킨지 글로벌 인스티튜트(McKinsey Global Institute)가 공개한 보고서에 따르면 2018년까지 미국 내에서만 분석 기술을 가진 인력이 14만 ~ 19만 명 정도 부족할 것으로 예상되며 대규모 데이터 세트의 분석을 활용해 효과적인 결정을 내릴 수 있는 방법을 알고 있는 관리자와 분석가는 약 150만 명 정도가 부족할 것으로 예상된다. "우리는 BI 리더의 등장으로 인해 순수한 상황 보고서가 아닌 진정한 추정 분석이 이루어질 것으로 본다"라고 50억 달러 규모의 생명공학 기업 바이오젠 아이덱(Biogen Idec)의 국제 IT 담당 부사장 그레그 메이어스는 말하며 "이는 기술적인 동시에 변화 관리와 관련한 문제다"라고 말했다. 포레스터 리서치 애널리스트 보리스 에벨슨은 지속적인 실업률 문제에도 불구하고 BI 인재 부족이 존재한다며, "대화를 나눈 모든 클라이언트는 BI 인재를 확보하고 보유하는데 어려움을 토로했다"라고 전했다. 그 공백을 메우기 위해 CIO들은 탄탄한 수학 능력과 거대한 데이터베이스 및 새로운 데이터베이스 기술을 능숙하게 다룰 수 있는 능력, 그리고 검색, 데이터 통합, 비즈니스 지식 등의 영역에 관련된 전문지식을 보유한 인력을 확보하기 위해 경쟁하고 있다. 에벨슨은 사실 프로세스, 고객, 제품 등을 이해하는 비즈니스 지식이 "기술 능력만큼이나 중요하다"라고 평가했다. 현재 IT 리더들는 지금 현재 필요한 분석 인재를 어떻게 확보...

2012.03.29

‘퍼즐 맞추기와 빅 데이터 분석은 유사’••• IBM 과학자 주장

IBM의 한 과학자가 데이터 분석과 퍼즐 맞추기의 유사점을 주장했다. “현대의 대규모 데이터 분석은 첨단 프로젝트일 수 있지만 현명한 데이터 과학자는 간단한 그림 퍼즐을 어떻게 해결하는지 관찰함으로써 기술을 향상시킬 수 있다.” 이는 최근 열렸던 기가옴(GigaOm) 컨퍼런스에서 IBM의 과학자가 주장한 내용이다. IBM의 본질 분석 수석 과학자 제프 조나스에 따르면, 사람들이 그림 퍼즐을 어떻게 맞추는지 보면 IBM이 빅 데이터 분석에 도입할 수 있는 많은 심오한 효과를 알 수 있다고 한다. 그는 지난 21일 뉴욕에서 열린 데이터 구조 컨퍼런스에서 기발한 프레젠테이션을 발표했다. 데이터 분석은 많은 기업들에게 더욱 중요한 구성 요소가 되고 있다. IDC는 기업들이 2015년까지 분석 시스템에 1,200억 달러 이상을 투자할 것으로 내다보고 있다. IBM은 2015년까지 기업 분석 매출이 160억 달러에 이를 것으로 전망하고 있다. 하지만 이런 시스템에서 유용한 결과를 얻기 위해서는 신중한 계획이 필요하다. 비공식적인 일련의 실험에서 조나스는 소규모 친구와 가족 집단이 협력해 수천 개의 조각으로 이뤄진 그림 퍼즐을 어떻게 맞추는지 관찰했다. "여자친구의 아들과 3명의 사촌이 함께 퍼즐을 맞추는 모습을 보았는데 나는 여기서 4개의 프로세서 파이프라인을 발견했다"라고 그는 말했다. 그는 문제의 난이도를 높이기 위해 몇몇 퍼즐 조각을 숨기고 일부 퍼즐의 중복된 조각을 포함해 놓았다. 퍼즐은 작은 그림 조각들을 하나의 큰 그림으로 맞추는 것이다. 여러모로 이것은 데이터 분석의 목표기도 하며, 더 큰 패턴을 보여주도록 데이터를 조합하는 방법을 찾아내는 것이라 할 수 있다. 많은 기업들이 ‘픽셀 분석’을 실행하면서 단일 데이터 포인트에서 너무 많은 것을 얻으려 하는 실수를 범한다고 조나스는 전했다. “문제는 짧은 시간 안에...

IBM 데이터 과학자 빅 데이터 퍼즐 맞추기

2012.03.27

IBM의 한 과학자가 데이터 분석과 퍼즐 맞추기의 유사점을 주장했다. “현대의 대규모 데이터 분석은 첨단 프로젝트일 수 있지만 현명한 데이터 과학자는 간단한 그림 퍼즐을 어떻게 해결하는지 관찰함으로써 기술을 향상시킬 수 있다.” 이는 최근 열렸던 기가옴(GigaOm) 컨퍼런스에서 IBM의 과학자가 주장한 내용이다. IBM의 본질 분석 수석 과학자 제프 조나스에 따르면, 사람들이 그림 퍼즐을 어떻게 맞추는지 보면 IBM이 빅 데이터 분석에 도입할 수 있는 많은 심오한 효과를 알 수 있다고 한다. 그는 지난 21일 뉴욕에서 열린 데이터 구조 컨퍼런스에서 기발한 프레젠테이션을 발표했다. 데이터 분석은 많은 기업들에게 더욱 중요한 구성 요소가 되고 있다. IDC는 기업들이 2015년까지 분석 시스템에 1,200억 달러 이상을 투자할 것으로 내다보고 있다. IBM은 2015년까지 기업 분석 매출이 160억 달러에 이를 것으로 전망하고 있다. 하지만 이런 시스템에서 유용한 결과를 얻기 위해서는 신중한 계획이 필요하다. 비공식적인 일련의 실험에서 조나스는 소규모 친구와 가족 집단이 협력해 수천 개의 조각으로 이뤄진 그림 퍼즐을 어떻게 맞추는지 관찰했다. "여자친구의 아들과 3명의 사촌이 함께 퍼즐을 맞추는 모습을 보았는데 나는 여기서 4개의 프로세서 파이프라인을 발견했다"라고 그는 말했다. 그는 문제의 난이도를 높이기 위해 몇몇 퍼즐 조각을 숨기고 일부 퍼즐의 중복된 조각을 포함해 놓았다. 퍼즐은 작은 그림 조각들을 하나의 큰 그림으로 맞추는 것이다. 여러모로 이것은 데이터 분석의 목표기도 하며, 더 큰 패턴을 보여주도록 데이터를 조합하는 방법을 찾아내는 것이라 할 수 있다. 많은 기업들이 ‘픽셀 분석’을 실행하면서 단일 데이터 포인트에서 너무 많은 것을 얻으려 하는 실수를 범한다고 조나스는 전했다. “문제는 짧은 시간 안에...

2012.03.27

기업 미래 좌우할 빅 데이터, 어떻게 준비할 것인가?

최근 빅 데이터에 대한 관심이 대단하다. 적지 않은 기업들이 자신들이 수집한 정보에서 어떤 비즈니스 인텔리전스를 끄집어낼 수 있는지를 궁금해하고 있다. 그럼에도 불구하고 구글이나 페이스북 등 극소수의 회사들만이 이를 자산화하고 있다. 하지만 이제 때가 됐다. 빅 데이터를 활용하고자 하는 기업들은 아파치 하둡(Apache Hadoop) 같은 복잡한 기초 기술을 이해해야 할뿐만 아니라, 데이터를 이해하고 확보하는데 도움을 줄 기반을 구축할 필요가 있다. 타타 컨설턴시 서비스(TCS: Tata Consultancy Service) 산하 글로벌 컨설팅 그룹의 글로벌 정보관리 책임자인 카일란 비스와나단에 따르면, 향후 3~5년 내에 빅 데이터를 이해해 활용하는 기업들과 이의 중요성을 인식하고 있지만 제대로 활용할 방법을 모르는 기업들 사이에 격차가 더욱 커질 전망이다. 즉 빅 데이터를 활용 가능한 정보로 전환시킨 기업들은 경쟁력을 갖게 된다. 비스와나단은 "현재 기업 대부분은 빅 데이터가 중요하다는 사실을 잘 알고 있다. 빅 데이터에 대한 정보도 많고 컨퍼런스도 개최되고 있다. 따라서 인식이 확산되고 있다는 점만은 분명하다. 그러나 빅 데이터 활용은 초기 단계에 불과한 실정이다"라고 말했다. 비스와나단은 페이스북과 구글 같이 데이터 관리와 개발에 전체 사업의 사활을 걸고 있는 인터넷 회사들이 빅 데이터를 견인하고 있다고 평가했다. 금융 산업, 정보, 국방 산업도 크게 뒤떨어지지 않은 상태이다. 또 소매와 통신, 헬스케어, 제조업도 이런 추세를 따를 전망이다. 비스와나단은 " 상대적으로 빨리 빅 데이터 활용을 준비해 해당 산업의 시장을 선도하는 기업이 되어야 한다. 신기술을 적극적으로 도입하는 기업들이 해당될 것이다. 이들은 빠른 속도로 빅 데이터를 활용할 준비를 하고, 해당 산업의 표준을 제시할 것이다"라고 강조했다. -> 준비되지 않은 빅 데이터 '빅 골칫거리 될 수...

데이터 보안 빅 데이터 시맨틱 스테이트 스트리트

2012.03.22

최근 빅 데이터에 대한 관심이 대단하다. 적지 않은 기업들이 자신들이 수집한 정보에서 어떤 비즈니스 인텔리전스를 끄집어낼 수 있는지를 궁금해하고 있다. 그럼에도 불구하고 구글이나 페이스북 등 극소수의 회사들만이 이를 자산화하고 있다. 하지만 이제 때가 됐다. 빅 데이터를 활용하고자 하는 기업들은 아파치 하둡(Apache Hadoop) 같은 복잡한 기초 기술을 이해해야 할뿐만 아니라, 데이터를 이해하고 확보하는데 도움을 줄 기반을 구축할 필요가 있다. 타타 컨설턴시 서비스(TCS: Tata Consultancy Service) 산하 글로벌 컨설팅 그룹의 글로벌 정보관리 책임자인 카일란 비스와나단에 따르면, 향후 3~5년 내에 빅 데이터를 이해해 활용하는 기업들과 이의 중요성을 인식하고 있지만 제대로 활용할 방법을 모르는 기업들 사이에 격차가 더욱 커질 전망이다. 즉 빅 데이터를 활용 가능한 정보로 전환시킨 기업들은 경쟁력을 갖게 된다. 비스와나단은 "현재 기업 대부분은 빅 데이터가 중요하다는 사실을 잘 알고 있다. 빅 데이터에 대한 정보도 많고 컨퍼런스도 개최되고 있다. 따라서 인식이 확산되고 있다는 점만은 분명하다. 그러나 빅 데이터 활용은 초기 단계에 불과한 실정이다"라고 말했다. 비스와나단은 페이스북과 구글 같이 데이터 관리와 개발에 전체 사업의 사활을 걸고 있는 인터넷 회사들이 빅 데이터를 견인하고 있다고 평가했다. 금융 산업, 정보, 국방 산업도 크게 뒤떨어지지 않은 상태이다. 또 소매와 통신, 헬스케어, 제조업도 이런 추세를 따를 전망이다. 비스와나단은 " 상대적으로 빨리 빅 데이터 활용을 준비해 해당 산업의 시장을 선도하는 기업이 되어야 한다. 신기술을 적극적으로 도입하는 기업들이 해당될 것이다. 이들은 빠른 속도로 빅 데이터를 활용할 준비를 하고, 해당 산업의 표준을 제시할 것이다"라고 강조했다. -> 준비되지 않은 빅 데이터 '빅 골칫거리 될 수...

2012.03.22

'빅 데이터를 클라우드에서' 구글, 빅쿼리 언급

구글이 뉴욕 기가옴(GigaOm) 데이터 컨퍼런스에서 자사의 데이터 분석 서비스에 대해 입을 열었다. 빅 데이터와 관련한 이야기 대부분은 분석 시스템이 인하우스(in-house), 즉 기업 내 소재한다고 상정하고 있다. 그러나 구글은 대용량 데이터를 클라우드에 저장하고 분석할 수 있도록 하는 서비스를 개발하고 있다. '빅쿼리'(BigQuery)라는 이름의 이 서비스는 기업이 별도의 인프라스트럭처를 구축하지 않고도 데이터를 분석할 수 있도록 하는 것이 골자다. 구글의 제품 매니저 주-카이 퀙은 뉴욕에서 열리고 있는 기가옴 스트럭처 데이터 컨퍼런스에서 이같이 밝히며 "애플리케이션 개발과 데이터 공유를 서비스 형태로 이용할 수 있다는 것"이라고 말했다. 그에 따르면 구글은 현재 소수의 고객사를 대산으로 프리뷰 모드 서비스를 제공하고 있다. 퀙은 이 서비스의 상용화 시점에 대해서는 언급하지 않았다. 구글은 자체 이용을 위해 데이터 분석 도구를 이미 개발했으며, 이를 활용한 쿼리 서비스를 상용화하는 것에 대해 검토해왔다. 퀙은 "웹을 인덱싱한다는 것은 빅 데이터와 관련한 문제다"라고 말하며 또 사용자들이 지메일과 같은 회사의 서비스를 어떻게 이용하는지에 대한 다량의 분석을 보유하고 있기도 하다고 전했다. 운영 데이터를 분석함으로써 어떤 기능이 제대로 동작하는지, 아니면 동작하지 않는지에 대한 정보를 감지할 수 있다는 이야기다. 그에 따르면 성공적인 분석을 위한 구글의 핵심 요소 중 하나는 생성한 데이터를 모두 저장하는 것이다. 퀙은 "잘게 나눠진 데이터(fine-grain data)가 핵심이다"라고 말했다. 많은 경우 구글 엔지니어들은 데이터 쿼리와 관련해 어떤 질문이 제기될지 알지 못한다. 핵심은 다양한 질문이다. 그는 "많은 질문을 빠르게 던져볼수록, 더욱 똑똑한 대답을 얻을 수 있다"라고 말했다. 구글 서비스 트라이얼 사용자들은 다양한 방식으로 이...

클라우드 구글 빅 데이터 빅쿼리 기가옴

2012.03.22

구글이 뉴욕 기가옴(GigaOm) 데이터 컨퍼런스에서 자사의 데이터 분석 서비스에 대해 입을 열었다. 빅 데이터와 관련한 이야기 대부분은 분석 시스템이 인하우스(in-house), 즉 기업 내 소재한다고 상정하고 있다. 그러나 구글은 대용량 데이터를 클라우드에 저장하고 분석할 수 있도록 하는 서비스를 개발하고 있다. '빅쿼리'(BigQuery)라는 이름의 이 서비스는 기업이 별도의 인프라스트럭처를 구축하지 않고도 데이터를 분석할 수 있도록 하는 것이 골자다. 구글의 제품 매니저 주-카이 퀙은 뉴욕에서 열리고 있는 기가옴 스트럭처 데이터 컨퍼런스에서 이같이 밝히며 "애플리케이션 개발과 데이터 공유를 서비스 형태로 이용할 수 있다는 것"이라고 말했다. 그에 따르면 구글은 현재 소수의 고객사를 대산으로 프리뷰 모드 서비스를 제공하고 있다. 퀙은 이 서비스의 상용화 시점에 대해서는 언급하지 않았다. 구글은 자체 이용을 위해 데이터 분석 도구를 이미 개발했으며, 이를 활용한 쿼리 서비스를 상용화하는 것에 대해 검토해왔다. 퀙은 "웹을 인덱싱한다는 것은 빅 데이터와 관련한 문제다"라고 말하며 또 사용자들이 지메일과 같은 회사의 서비스를 어떻게 이용하는지에 대한 다량의 분석을 보유하고 있기도 하다고 전했다. 운영 데이터를 분석함으로써 어떤 기능이 제대로 동작하는지, 아니면 동작하지 않는지에 대한 정보를 감지할 수 있다는 이야기다. 그에 따르면 성공적인 분석을 위한 구글의 핵심 요소 중 하나는 생성한 데이터를 모두 저장하는 것이다. 퀙은 "잘게 나눠진 데이터(fine-grain data)가 핵심이다"라고 말했다. 많은 경우 구글 엔지니어들은 데이터 쿼리와 관련해 어떤 질문이 제기될지 알지 못한다. 핵심은 다양한 질문이다. 그는 "많은 질문을 빠르게 던져볼수록, 더욱 똑똑한 대답을 얻을 수 있다"라고 말했다. 구글 서비스 트라이얼 사용자들은 다양한 방식으로 이...

2012.03.22

빅 데이터와 IT가 만날 때

기업 IT가 장기적으로 적합한 지를 판단할 때가 다가오고 있으며, 빅 데이터와 클라우드 컴퓨팅은 논란을 불식시키는데 일익을 담당할 것이다. 클라우드 컴퓨팅의 마지막 과대광고 주기 이후부터 기업에서 IT의 역할에 대한 비관적인 전망들이 대거 쏟아져 나왔다. 논리는 간단하다. 서버 운영의 대부분이 자동화된다면 시스템 관리자들이 필요하게 될까? 이런 종류의 이야기는 시스템 관리자들을 불안에 떨게 하며, 특히 일반적으로 기업들이 주가를 올리기 위해서는 인력을 감축해야 한다고 믿는 상황에서는 더욱 그렇다. 디봅스(DevOps: 개발과 운영을 병행하는 인력)같은 IT 개념은 시스템 운영자가 방어적인 자세를 취하도록 하는 경향이 있다. 어쨌든 개발자들이 클라우드 기반 애플리케이션 내의 작업 할당량 마저 담당하게 되면 시스템과 데이터베이스 관리자들에 대한 수요가 더 감소하지 않을까? 그리고 IT를 궁지로 내몰 수 있는 잠재력이 있다고 말하는 빅 데이터도 있다. 이런 주장이 그다지 간단한 것은 아니지만 기본적으로 MBA 학위를 가진 직원들이 비즈니스 인텔리전스(BI) 및 데이터 분석툴을 더 쉽게 사용할 수 있게 되면 ‘순수한’ 데이터 관리자에 대한 필요성이 감소하여 IT 전체의 가치가 하락할 것으로 가정하고 있다. 여러분은 빅 데이터 기기와 호스팅되는 빅 데이터 서비스의 물결 앞에서 단념한 채 IT가 더욱 축소될 것이라 확신하고 있는가? 아닐 것이다. 몇 주 전 스트라타(Strata) 컨퍼런스에서 목격한 바를 근거로 필자는 빅 데이터 분야에 IT를 위한 엄청난 공간이 존재할 뿐 아니라 빅 데이터가 IT를 기업에 더욱 필요한 존재로 만들 수도 있다고 말하고 싶다. 대부분의 사람들은 기업이 다양한 출처로부터 엄청난 데이터를 수집하고 있다는 것을 알고 있으며 (a) 이것으로 무엇을 할 수 있고 (b) 여기서 배운 것을 어떻게 기업 사례에 다시 적용할지를 알아내기 위해서 노력하고 있다. 이것은 시스템 운영과 자동화...

클라우드 개발자 데이터 과학자 빅 데이터 운영자

2012.03.16

기업 IT가 장기적으로 적합한 지를 판단할 때가 다가오고 있으며, 빅 데이터와 클라우드 컴퓨팅은 논란을 불식시키는데 일익을 담당할 것이다. 클라우드 컴퓨팅의 마지막 과대광고 주기 이후부터 기업에서 IT의 역할에 대한 비관적인 전망들이 대거 쏟아져 나왔다. 논리는 간단하다. 서버 운영의 대부분이 자동화된다면 시스템 관리자들이 필요하게 될까? 이런 종류의 이야기는 시스템 관리자들을 불안에 떨게 하며, 특히 일반적으로 기업들이 주가를 올리기 위해서는 인력을 감축해야 한다고 믿는 상황에서는 더욱 그렇다. 디봅스(DevOps: 개발과 운영을 병행하는 인력)같은 IT 개념은 시스템 운영자가 방어적인 자세를 취하도록 하는 경향이 있다. 어쨌든 개발자들이 클라우드 기반 애플리케이션 내의 작업 할당량 마저 담당하게 되면 시스템과 데이터베이스 관리자들에 대한 수요가 더 감소하지 않을까? 그리고 IT를 궁지로 내몰 수 있는 잠재력이 있다고 말하는 빅 데이터도 있다. 이런 주장이 그다지 간단한 것은 아니지만 기본적으로 MBA 학위를 가진 직원들이 비즈니스 인텔리전스(BI) 및 데이터 분석툴을 더 쉽게 사용할 수 있게 되면 ‘순수한’ 데이터 관리자에 대한 필요성이 감소하여 IT 전체의 가치가 하락할 것으로 가정하고 있다. 여러분은 빅 데이터 기기와 호스팅되는 빅 데이터 서비스의 물결 앞에서 단념한 채 IT가 더욱 축소될 것이라 확신하고 있는가? 아닐 것이다. 몇 주 전 스트라타(Strata) 컨퍼런스에서 목격한 바를 근거로 필자는 빅 데이터 분야에 IT를 위한 엄청난 공간이 존재할 뿐 아니라 빅 데이터가 IT를 기업에 더욱 필요한 존재로 만들 수도 있다고 말하고 싶다. 대부분의 사람들은 기업이 다양한 출처로부터 엄청난 데이터를 수집하고 있다는 것을 알고 있으며 (a) 이것으로 무엇을 할 수 있고 (b) 여기서 배운 것을 어떻게 기업 사례에 다시 적용할지를 알아내기 위해서 노력하고 있다. 이것은 시스템 운영과 자동화...

2012.03.16

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.13