Offcanvas

���������

"클라우드가 빅 데이터의 고민 해결 가능" AWS 매트 우드 박사

“정형•비정형 데이터를 분석하는 기업들의 고민 해결에 클라우드 또는 유틸리티 컴퓨팅 모델이 도움될 수 있다.” 이는 아마존 웹 서비스(AWS)에서 데이터 과학을 담당하는 글로벌 제너럴 매니저인 매트 우드 박사의 주장이다. 생물정보학 박사 학위를 받은 우드 박사는 “전통적인 프로비저닝 IT인프라에 들어 있는 데이터를 분석할 때, 기업들은 스토리지 용량의 제한을 받으며 활용 가능한 용량을 계산한다”고 말했다. "우리는 초기에 분석 기능을 폭넓게 구축한 이 유틸리티 컴퓨팅 플랫폼을 사용할 수 있는 고객들을 보았다. 전통적인 프로비저닝 인프라에서 고객들이 분석에 대해 고민하기 시작할 때, 그들은 자신들이 추출하고자 하는 데이터와 정보에 대해 묻고 싶은 질문들을 담고자 했다. 이 데이터와 정보는 그들이 가진 대용량 스토리지와 컴퓨팅 용량으로 제한되기 때문이다”라고 우드 박사는 전했다. 유틸리티 컴퓨팅은 이러한 제약을 없애고 기업이 자신의 비즈니스를 개선하는 데 도움을 줄, 실행 가능한 정보로 이어주며, 바로 여기서 데이터에 대한 질문을 시작할 수 있다고 그는 말했다. "빅 데이터는 엑사바이트나 페타바이트 데이터를 관리하는 것에 대한 게 아니다. 그것은 당신이 이미 가지고 있는 정보에서 가치를 추출하고 좀더 생산적으로 일하는 것에 대한 것이다. 빅 데이터는 서로 다른 정보원을 재차 확인하고 상관관계와 동향을 파악하며 고객이 필요로 하는 질문에 정확한 대답을 정확하게 하는 사람으로 연결해 주는 것에 대한 것이다”라고 그는 설명했다. 우드 박사는 빅커머스(Bigcommerce)를 예로 들어 설명을 이었다. 빅커머스는 AWS에서 운영하는 30만 개의 전자상거래 사이트를 가지고 있으며, 이들이 성장함에 따라 새로운 기술과 아이디어를 신속하면서도 상대적으로 낮은 비용으로 도입할 수 있게 해준다. 우드 박사는 자사의 애플리케이션 내에서 프리미엄 목...

데이터 유틸리티 컴퓨팅 정형 비정형 빅 데이터 해결 고민 용량 AWS 스토리지 아마존 웹 서비스

2013.09.11

“정형•비정형 데이터를 분석하는 기업들의 고민 해결에 클라우드 또는 유틸리티 컴퓨팅 모델이 도움될 수 있다.” 이는 아마존 웹 서비스(AWS)에서 데이터 과학을 담당하는 글로벌 제너럴 매니저인 매트 우드 박사의 주장이다. 생물정보학 박사 학위를 받은 우드 박사는 “전통적인 프로비저닝 IT인프라에 들어 있는 데이터를 분석할 때, 기업들은 스토리지 용량의 제한을 받으며 활용 가능한 용량을 계산한다”고 말했다. "우리는 초기에 분석 기능을 폭넓게 구축한 이 유틸리티 컴퓨팅 플랫폼을 사용할 수 있는 고객들을 보았다. 전통적인 프로비저닝 인프라에서 고객들이 분석에 대해 고민하기 시작할 때, 그들은 자신들이 추출하고자 하는 데이터와 정보에 대해 묻고 싶은 질문들을 담고자 했다. 이 데이터와 정보는 그들이 가진 대용량 스토리지와 컴퓨팅 용량으로 제한되기 때문이다”라고 우드 박사는 전했다. 유틸리티 컴퓨팅은 이러한 제약을 없애고 기업이 자신의 비즈니스를 개선하는 데 도움을 줄, 실행 가능한 정보로 이어주며, 바로 여기서 데이터에 대한 질문을 시작할 수 있다고 그는 말했다. "빅 데이터는 엑사바이트나 페타바이트 데이터를 관리하는 것에 대한 게 아니다. 그것은 당신이 이미 가지고 있는 정보에서 가치를 추출하고 좀더 생산적으로 일하는 것에 대한 것이다. 빅 데이터는 서로 다른 정보원을 재차 확인하고 상관관계와 동향을 파악하며 고객이 필요로 하는 질문에 정확한 대답을 정확하게 하는 사람으로 연결해 주는 것에 대한 것이다”라고 그는 설명했다. 우드 박사는 빅커머스(Bigcommerce)를 예로 들어 설명을 이었다. 빅커머스는 AWS에서 운영하는 30만 개의 전자상거래 사이트를 가지고 있으며, 이들이 성장함에 따라 새로운 기술과 아이디어를 신속하면서도 상대적으로 낮은 비용으로 도입할 수 있게 해준다. 우드 박사는 자사의 애플리케이션 내에서 프리미엄 목...

2013.09.11

빅 데이터에서 금맥 찾은 마케터, '하지만 난관도 많다'

데이터 주도적인 마케팅 전략을 전개해야 한다는 압박을 느끼는 마케터들은 빅 데이터 분석이 앞으로 마케팅부서의 중요한 부분이 될 것이라는 주장에 동의하고 있다. 그러나 데이터 분석 기술 인력의 부족과 오래된 비즈니스 프로세스 때문에 마케터들의 노력이 빛을 발하지 못하고 있다. 테라데이타(Teradata)가 올 3월과 5월 전세계 2,200 명의 마케터들을 대상으로 진행한 데이터 주도 마케팅 조사 2013(Data Driven Marketing Survey 2013)이 얼마 전 공개됐다. 테라데이타가 정의하는 데이터 주도 마케팅이란 대량의 데이터를 수집하고 연결해 이를 분석함으로써 새로운 관점을 얻고 개별 고객들의 특성에서 마케팅 가치를 추출하는 마케팅 인터랙션(marketing interaction) 과정을 통해 이 데이터를 시장에 적용하는 일련의 과정을 의미한다. 테라데이타의 애플리케이션 담당 부사장 베스 무어는 “데이터 주도 마케팅이 새로운 개념은 아니다. 이는 아마 초기 마케팅 시장에서도 존재해오던 개념이라 말할 수도 있을 것이다. 하지만 소비자 채널, 그리고 소비자들의 기대는 계속해서 변화하고 있다. 이것이 마케터들이 데이터에 더 많은 노력을 쏟아야 하는 이유다”라고 말했다. 무어의 말은 마케터들의 데이터 활용에 부족함이 있다는 뜻이 아니다. 무어는 그간 마케팅 활동에 쓰였던 데이터란 대부분 수치, 혹은 손쉽게 접근 가능한 형태의 데이터였다고 말했다. “예를 들자면, 조사에 참여한 마케터 가운데 75% 이상이 이미 고객 서비스 데이터, 고객 만족도 데이터, 디지털 상호 작용 데이터, 인구 데이터 등을 마케팅에 활용하고 있었다. 여기에서 한 발 더 나아가 고객 참여 데이터, 거래 데이터, 전자상거래 데이터 등으로 까지 활용 영역을 높이고 있는 마케터의 비율도 50%를 넘는다”라고 그는 설명했다. 데이터 주도 마케팅, 비정형 데이터가 핵심 하지만 진정한 데이터 주도...

마케팅 고객 CMO 빅 데이터 비정형 마케터 분석 데이터 주도

2013.08.13

데이터 주도적인 마케팅 전략을 전개해야 한다는 압박을 느끼는 마케터들은 빅 데이터 분석이 앞으로 마케팅부서의 중요한 부분이 될 것이라는 주장에 동의하고 있다. 그러나 데이터 분석 기술 인력의 부족과 오래된 비즈니스 프로세스 때문에 마케터들의 노력이 빛을 발하지 못하고 있다. 테라데이타(Teradata)가 올 3월과 5월 전세계 2,200 명의 마케터들을 대상으로 진행한 데이터 주도 마케팅 조사 2013(Data Driven Marketing Survey 2013)이 얼마 전 공개됐다. 테라데이타가 정의하는 데이터 주도 마케팅이란 대량의 데이터를 수집하고 연결해 이를 분석함으로써 새로운 관점을 얻고 개별 고객들의 특성에서 마케팅 가치를 추출하는 마케팅 인터랙션(marketing interaction) 과정을 통해 이 데이터를 시장에 적용하는 일련의 과정을 의미한다. 테라데이타의 애플리케이션 담당 부사장 베스 무어는 “데이터 주도 마케팅이 새로운 개념은 아니다. 이는 아마 초기 마케팅 시장에서도 존재해오던 개념이라 말할 수도 있을 것이다. 하지만 소비자 채널, 그리고 소비자들의 기대는 계속해서 변화하고 있다. 이것이 마케터들이 데이터에 더 많은 노력을 쏟아야 하는 이유다”라고 말했다. 무어의 말은 마케터들의 데이터 활용에 부족함이 있다는 뜻이 아니다. 무어는 그간 마케팅 활동에 쓰였던 데이터란 대부분 수치, 혹은 손쉽게 접근 가능한 형태의 데이터였다고 말했다. “예를 들자면, 조사에 참여한 마케터 가운데 75% 이상이 이미 고객 서비스 데이터, 고객 만족도 데이터, 디지털 상호 작용 데이터, 인구 데이터 등을 마케팅에 활용하고 있었다. 여기에서 한 발 더 나아가 고객 참여 데이터, 거래 데이터, 전자상거래 데이터 등으로 까지 활용 영역을 높이고 있는 마케터의 비율도 50%를 넘는다”라고 그는 설명했다. 데이터 주도 마케팅, 비정형 데이터가 핵심 하지만 진정한 데이터 주도...

2013.08.13

가트너 기고 | 빅 콘텐츠: 빅 데이터의 비정렬적 측면 관리

정보 홍수 시대가 서서히 끝나가고 있다. 기업들이 이제 대량의 데이터, 콘텐츠 및 정보를 처리하는데 익숙해지고 있다. 정보 생성 속도가 계속 빨라지고 있지만 그 속도에 걸맞는 정보 관리 인프라와 역량은 곧 현실화를 앞두고 있다. 이제 빅 데이터(Big data)는 저주가 아닌 축복이다. 그렇다 하더라도 정보 관리가 전면적인 정보 활용과 같을 순 없다. 빅 데이터 기술이 기업 데이터에 숨겨져 있던 비밀을 밝혀내고 있지만, 잠재적 통찰 및 지식 자원의 보고인 ‘빅 콘텐츠’는 아직까지도 많은 부분 활용되지 않고 있다. 비정형(Unstructured) 콘텐츠는 기업 총 정보 자산의 최대 80%를 차지한다. 빅 데이터 기술이 비정형 정보 탐색에 적합함에도 불구하고, 빅 콘텐츠(Big Content)는 상당 부분 활용되지 못한 채 미개척 분야로 남아있다. 가트너는 비정형 데이터를 기존의 정형화된 특정 데이터 모델을 따르지 않는 콘텐츠로 정의한다. 비정형 데이터는 인간이 생성한 사람 기반의 콘텐츠로 데이터베이스 테이블에 딱 들어맞지 않는 경향이 있다. 기업 내 비정형 콘텐츠는 주로 보고서, 프리젠테이션, 엑셀 시트 등과 같은 비즈니스 문서, 이메일, 웹 콘텐츠 등 다양한 형태로 존재한다. 각각의 콘텐츠 소스에는 이들을 뒷받침하는 관리 규칙들이 존재한다. 예를 들어, 비즈니스 문서는 처음부터 끝까지 ECM 플랫폼으로 관리되며 이메일의 경우, 다른 텍스트 기반의 커뮤니케이션 채널과 함께 관리, 관찰 및 저장된다. 더욱 정교해지는 웹 콘텐츠 역시 그 만큼 정교해진 웹 콘텐츠 관리(Web Content Management) 툴로 관리된다. 각각의 플랫폼은 분석 및 탐색보다 관리와 유지에 집중한다. 해당 플랫폼은 대상 콘텐츠에 고급 분석 및 탐색 기능을 제공하기 위한 것이 아니며 그럴 수도 없지만, 빅 콘텐츠 인프라를 뒷받침하는 탄탄한 기반을 제공할 수는 있다. 기업이 소유하고, 운영하는 정보는 빅 콘텐츠 중 일부에 불과...

가트너 빅 데이터 비정형 준정형 빅 콘텐츠

2013.07.01

정보 홍수 시대가 서서히 끝나가고 있다. 기업들이 이제 대량의 데이터, 콘텐츠 및 정보를 처리하는데 익숙해지고 있다. 정보 생성 속도가 계속 빨라지고 있지만 그 속도에 걸맞는 정보 관리 인프라와 역량은 곧 현실화를 앞두고 있다. 이제 빅 데이터(Big data)는 저주가 아닌 축복이다. 그렇다 하더라도 정보 관리가 전면적인 정보 활용과 같을 순 없다. 빅 데이터 기술이 기업 데이터에 숨겨져 있던 비밀을 밝혀내고 있지만, 잠재적 통찰 및 지식 자원의 보고인 ‘빅 콘텐츠’는 아직까지도 많은 부분 활용되지 않고 있다. 비정형(Unstructured) 콘텐츠는 기업 총 정보 자산의 최대 80%를 차지한다. 빅 데이터 기술이 비정형 정보 탐색에 적합함에도 불구하고, 빅 콘텐츠(Big Content)는 상당 부분 활용되지 못한 채 미개척 분야로 남아있다. 가트너는 비정형 데이터를 기존의 정형화된 특정 데이터 모델을 따르지 않는 콘텐츠로 정의한다. 비정형 데이터는 인간이 생성한 사람 기반의 콘텐츠로 데이터베이스 테이블에 딱 들어맞지 않는 경향이 있다. 기업 내 비정형 콘텐츠는 주로 보고서, 프리젠테이션, 엑셀 시트 등과 같은 비즈니스 문서, 이메일, 웹 콘텐츠 등 다양한 형태로 존재한다. 각각의 콘텐츠 소스에는 이들을 뒷받침하는 관리 규칙들이 존재한다. 예를 들어, 비즈니스 문서는 처음부터 끝까지 ECM 플랫폼으로 관리되며 이메일의 경우, 다른 텍스트 기반의 커뮤니케이션 채널과 함께 관리, 관찰 및 저장된다. 더욱 정교해지는 웹 콘텐츠 역시 그 만큼 정교해진 웹 콘텐츠 관리(Web Content Management) 툴로 관리된다. 각각의 플랫폼은 분석 및 탐색보다 관리와 유지에 집중한다. 해당 플랫폼은 대상 콘텐츠에 고급 분석 및 탐색 기능을 제공하기 위한 것이 아니며 그럴 수도 없지만, 빅 콘텐츠 인프라를 뒷받침하는 탄탄한 기반을 제공할 수는 있다. 기업이 소유하고, 운영하는 정보는 빅 콘텐츠 중 일부에 불과...

2013.07.01

"빅 데이터에 보안 위한 애플리케이션 있다" 테라데이타

테라데이타가 빅 데이터를 통해 지속적인 보안 모니터링이 이뤄진다고 밝혔다. 빅 데이터 툴이 법 감식에서 보안 전문가를 위한 가치를 제공할 수 있다. 테라데이타 엔터프라이즈 리스크 관리 이사 샘 해리스에 따르면, 통신 및 네트워크 데이터를 모니터링 한 결과 기계에서 생성되는 데이터가 점점 더 증가하고 있으며 어떤 일일 일어나고 있는지 식별하기 어려워지고 있다. "그 결과 스피어 피싱이나 경계 방어에 대한 악성코드 같은 일부 침입이 시작됐다”고 해리스는 전했다. 해리스는 "빅 데이터가 많은 사람들에게 많은 것들을 의미한다”며 “모든 빅 데이터가 비정형이라는 개념은 잘못됐다”고 말했다. "모든 데이터는 구조를 가지고 있지만 그것이 당신이 생각하는 구조는 아니다"라고 그는 덧붙였다. 다행히 회사가 지속적으로 네트워크를 모니터링 한다면, 회사가 일반적으로 네트워크에서 사용하지 않을 프로토콜을 활용하고 있는 통신 같은 것들이 많이 있다고 해리스는 설명했다. "그것은 당신의 네트워크에 악성코드가 있는 지를 알려주는 신호"라고 그는 말했다. --------------------------------------------------------------- 빅 데이터와 보안 인기기사 -> 사례 | '빅 데이터로 보안 역량 개선' 지온스의 성공담 -> 칼럼 | 빅 데이터가 보안의 해답이 될까? -> 빅 데이터를 정보 보안에 적용하기 “유효하긴 하지만···” -> 빅 데이터의 화룡정점은 '빅 보안' ' -> 테라데이타, '사이버공격 방어를 위한 빅데이터 분석' 연구 결과 발표 -----------------------------------------------------------...

모니터링 네트워크 테라데이타 비정형 정형

2013.06.28

테라데이타가 빅 데이터를 통해 지속적인 보안 모니터링이 이뤄진다고 밝혔다. 빅 데이터 툴이 법 감식에서 보안 전문가를 위한 가치를 제공할 수 있다. 테라데이타 엔터프라이즈 리스크 관리 이사 샘 해리스에 따르면, 통신 및 네트워크 데이터를 모니터링 한 결과 기계에서 생성되는 데이터가 점점 더 증가하고 있으며 어떤 일일 일어나고 있는지 식별하기 어려워지고 있다. "그 결과 스피어 피싱이나 경계 방어에 대한 악성코드 같은 일부 침입이 시작됐다”고 해리스는 전했다. 해리스는 "빅 데이터가 많은 사람들에게 많은 것들을 의미한다”며 “모든 빅 데이터가 비정형이라는 개념은 잘못됐다”고 말했다. "모든 데이터는 구조를 가지고 있지만 그것이 당신이 생각하는 구조는 아니다"라고 그는 덧붙였다. 다행히 회사가 지속적으로 네트워크를 모니터링 한다면, 회사가 일반적으로 네트워크에서 사용하지 않을 프로토콜을 활용하고 있는 통신 같은 것들이 많이 있다고 해리스는 설명했다. "그것은 당신의 네트워크에 악성코드가 있는 지를 알려주는 신호"라고 그는 말했다. --------------------------------------------------------------- 빅 데이터와 보안 인기기사 -> 사례 | '빅 데이터로 보안 역량 개선' 지온스의 성공담 -> 칼럼 | 빅 데이터가 보안의 해답이 될까? -> 빅 데이터를 정보 보안에 적용하기 “유효하긴 하지만···” -> 빅 데이터의 화룡정점은 '빅 보안' ' -> 테라데이타, '사이버공격 방어를 위한 빅데이터 분석' 연구 결과 발표 -----------------------------------------------------------...

2013.06.28

빅 데이터에 대한 5가지 오해

솔루션 업체, 애널리스트, IT리더들, 거의 모든 사람들이 빅 데이터에 대해 각자 나름의 정의를 내리고 있으며 그들이 빅 데이터에서 기대하는 바 역시 제각각이다. 하지만 껍데기를 버리고 알맹이만 취하는 것은 중요하다. 그래서 빅 데이터에 대해 무엇이 맞고 무엇이 틀린 지를 알아보자. 빅 데이터는 오해의 소지가 다분한 모든 요소를 가지고 있다. 빅 데이터는 비교적 새롭고, 각각의 분야에서 고유한 성숙곡선을 타면서 성장하는 작은 기술들로 구성된 복잡한 시장이며, 현재 다소 과장돼 있다. 빅 데이터에 대한 오해를 풀고 IT리더와 애널리스트들이 지적한 빅 데이터의 정의, 기대치, 가능성에 대해 소개하고자 한다. 오해 1 : 빅 데이터는 비정형 데이터에 관한 것이다 소셜 미디어 사이트에서 비정형 데이터를 분석하는 것만으로 빅 데이터를 설명할 수는 없다. 가트너 연구 담당 선임 애널리스트 시드 데시팬데는 "데이터 용량, 빠른 속도, 다양성으로 어려움을 겪고 있는 기업들은 빅 데이터 문제를 안고 있는 조직이다"라고 지적했다. 인도 회사인 MTS의 CIO 라지브 트라의 예를 들어 보겠다. 개인정보 보호법 때문에 고객의 페이스북 계정으로 접속할 수 없다. 그러나 그의 시스템은 더 나은 고객 서비스를 제공하기 위해 매일 110TB의 정형 데이터에서 정보를 처리하고 있다. 오해 2 : 빅 데이터의 가장 큰 장점은 더 나은 고객 서비스다 빅 데이터의 가장 우수한 사례는 고객 서비스를 개선에 이를 활용한 기업들에서 나왔다. 하지만 가트너는 그것이 빅 데이터에서 파생된 가장 큰 장점은 아니라는 사실을 알아냈다. "기업들에게 빅 데이터를 통해 얻고자 하는 혜택 중 가장 큰 것이 무엇이냐고 물었을 때, 프로세스 효율이 가장 큰 비중을 차지했다. 그 다음으로 보안 위험 영역 파악하기, 고객 만족의 새로운 영역 찾기 등이 지목됐다"라고 데시팬데는 말했다. 오해 3 : 빅 데이터는 IT프로젝트다 물론, 빅 데...

오해 빅 데이터 비정형 정의 분석

2013.05.31

솔루션 업체, 애널리스트, IT리더들, 거의 모든 사람들이 빅 데이터에 대해 각자 나름의 정의를 내리고 있으며 그들이 빅 데이터에서 기대하는 바 역시 제각각이다. 하지만 껍데기를 버리고 알맹이만 취하는 것은 중요하다. 그래서 빅 데이터에 대해 무엇이 맞고 무엇이 틀린 지를 알아보자. 빅 데이터는 오해의 소지가 다분한 모든 요소를 가지고 있다. 빅 데이터는 비교적 새롭고, 각각의 분야에서 고유한 성숙곡선을 타면서 성장하는 작은 기술들로 구성된 복잡한 시장이며, 현재 다소 과장돼 있다. 빅 데이터에 대한 오해를 풀고 IT리더와 애널리스트들이 지적한 빅 데이터의 정의, 기대치, 가능성에 대해 소개하고자 한다. 오해 1 : 빅 데이터는 비정형 데이터에 관한 것이다 소셜 미디어 사이트에서 비정형 데이터를 분석하는 것만으로 빅 데이터를 설명할 수는 없다. 가트너 연구 담당 선임 애널리스트 시드 데시팬데는 "데이터 용량, 빠른 속도, 다양성으로 어려움을 겪고 있는 기업들은 빅 데이터 문제를 안고 있는 조직이다"라고 지적했다. 인도 회사인 MTS의 CIO 라지브 트라의 예를 들어 보겠다. 개인정보 보호법 때문에 고객의 페이스북 계정으로 접속할 수 없다. 그러나 그의 시스템은 더 나은 고객 서비스를 제공하기 위해 매일 110TB의 정형 데이터에서 정보를 처리하고 있다. 오해 2 : 빅 데이터의 가장 큰 장점은 더 나은 고객 서비스다 빅 데이터의 가장 우수한 사례는 고객 서비스를 개선에 이를 활용한 기업들에서 나왔다. 하지만 가트너는 그것이 빅 데이터에서 파생된 가장 큰 장점은 아니라는 사실을 알아냈다. "기업들에게 빅 데이터를 통해 얻고자 하는 혜택 중 가장 큰 것이 무엇이냐고 물었을 때, 프로세스 효율이 가장 큰 비중을 차지했다. 그 다음으로 보안 위험 영역 파악하기, 고객 만족의 새로운 영역 찾기 등이 지목됐다"라고 데시팬데는 말했다. 오해 3 : 빅 데이터는 IT프로젝트다 물론, 빅 데...

2013.05.31

“빅 데이터, 어떻게 활용할 것인가” 방향 제시••• 빅 데이터 월드 2012

7일 서울 엘타워 6층 그레이스홀에서 300여 명이 참석한 가운데 한국IDG의 빅 데이터 월드 2012가 개최됐다. 기조연설자로 나선 이베이의 상품관리 시장분석 및 플랫폼 기술 총괄 가야트리 파텔 이사는 이베이가 빅 데이터를 어떻게 활용했는지를 설명했다. 10여년 동안 이베이에서 데이터 관련 업무를 맡은 파텔은 “그동안 많은 도전을 겪으면서 경쟁우위를 확보할 수 있었던 데에는 데이터의 위력이 크게 작용했다”라고 밝혔다. 특히 최근 3년 동안 이베이의 도전 과제는 ‘빅 데이터가 우리 사회에 어떻게 영향을 주며, 어떻게 하면 빅 데이터로 경쟁우위를 확보하고 돌파구를 마련할까’였다. 이베이는 빅 데이터를 활용해 고객을 이해하고 의사결정을 내리고 있다. 이베이의 마켓플레이스에는 상품 카테고리만 5만 개며 거래 상품들은 이보다 훨씬 많으며 매일 수 천만 명의 고객들이 거래하고 있다. 파텔 이사는 “온라인으로 고객이 어떻게 활동하는지 아는 것이 이베이의 임무다. 과거에는 거래 데이터만을 분석했으나 이제는 아니다. 거래 전에 고객이 왜 이베이에 방문하고 이베이에서 무엇을 했는지, 예를 들면 카트에 어떤 물건들을 담고 어떤 것을 알고 싶어 하고 어떤 키워드로 검색을 했는지 등의 정보까지도 수집해 분석하고 있다”라고 밝혔다. 파텔에 따르면 이베이에는 6개 부류의 데이터 의사결정권자들이 있으며, 기조연설에서 4개 부류에 대해서만 언급했다. 첫번째 부류는 분석가들로서 전문성을 가지고 데이터 순서와 배열에 대해 완벽하게 이해하는 사람들이다. 이들은 통계학적 지식을 가지고 기회를 찾고 어떻게 할 지를 분석하고 있다. 두번째 부류는 과학자들로 새로운 알고르즘과 패턴을 연구하고 데이터를 마이닝하는 사람들이다. 이들은 어떻게 하면 이베이의 상품에 맞게 전략을 조정할까를 고민하는 사람들이다. 세번째 부류는 프로덕트 매니저와 마케팅 매니저로 통계, IT, 컴퓨팅에 대해 잘 모르지만 제품과 산업에 대한 ...

이베이 비정형 정형 분석 빅 데이터 월드 준정형

2012.11.07

7일 서울 엘타워 6층 그레이스홀에서 300여 명이 참석한 가운데 한국IDG의 빅 데이터 월드 2012가 개최됐다. 기조연설자로 나선 이베이의 상품관리 시장분석 및 플랫폼 기술 총괄 가야트리 파텔 이사는 이베이가 빅 데이터를 어떻게 활용했는지를 설명했다. 10여년 동안 이베이에서 데이터 관련 업무를 맡은 파텔은 “그동안 많은 도전을 겪으면서 경쟁우위를 확보할 수 있었던 데에는 데이터의 위력이 크게 작용했다”라고 밝혔다. 특히 최근 3년 동안 이베이의 도전 과제는 ‘빅 데이터가 우리 사회에 어떻게 영향을 주며, 어떻게 하면 빅 데이터로 경쟁우위를 확보하고 돌파구를 마련할까’였다. 이베이는 빅 데이터를 활용해 고객을 이해하고 의사결정을 내리고 있다. 이베이의 마켓플레이스에는 상품 카테고리만 5만 개며 거래 상품들은 이보다 훨씬 많으며 매일 수 천만 명의 고객들이 거래하고 있다. 파텔 이사는 “온라인으로 고객이 어떻게 활동하는지 아는 것이 이베이의 임무다. 과거에는 거래 데이터만을 분석했으나 이제는 아니다. 거래 전에 고객이 왜 이베이에 방문하고 이베이에서 무엇을 했는지, 예를 들면 카트에 어떤 물건들을 담고 어떤 것을 알고 싶어 하고 어떤 키워드로 검색을 했는지 등의 정보까지도 수집해 분석하고 있다”라고 밝혔다. 파텔에 따르면 이베이에는 6개 부류의 데이터 의사결정권자들이 있으며, 기조연설에서 4개 부류에 대해서만 언급했다. 첫번째 부류는 분석가들로서 전문성을 가지고 데이터 순서와 배열에 대해 완벽하게 이해하는 사람들이다. 이들은 통계학적 지식을 가지고 기회를 찾고 어떻게 할 지를 분석하고 있다. 두번째 부류는 과학자들로 새로운 알고르즘과 패턴을 연구하고 데이터를 마이닝하는 사람들이다. 이들은 어떻게 하면 이베이의 상품에 맞게 전략을 조정할까를 고민하는 사람들이다. 세번째 부류는 프로덕트 매니저와 마케팅 매니저로 통계, IT, 컴퓨팅에 대해 잘 모르지만 제품과 산업에 대한 ...

2012.11.07

“빅 데이터가 우리 회사를 바꿔 놓을 수 있다”

빅 데이터에 대한 공통된 정의는 없다. 그러나 일반적으로 3가지 기준 가운데 2가지에 부합하면 빅 데이터라고 일컫는다. -규모(Volume) : 대용량 데이터 세트 -속도(Velocity) : 빠른 데이터 처리 -다양성(Variety): 기업 외부에서 만들어지는 비정형, 반정형, 정형 데이터 예를 들어, 고객이 특정 기업의 CRM 시스템에 저장해둔 데이터는 정형 데이터다. 그러나 이메일과 댓글, 소셜 미디어, 동영상 콘텐츠는 정형 데이터가 아니다. 대부분의 경우, 데이터는 이 3가지 요소를 두루 갖추게 된다. 그러나 빅 데이터가 반드시 대규모일 필요는 없다는 점에 주목해야 한다. 빅 데이터에 관심을 갖는 이유는 경쟁력을 확보할 수 있기 때문이다. 예를 들어, 보험회사는 보험사기를 막고자 있지만 보험사기는 이보다 더 빠르게 증가하고 있다. 자동차 보험금의 10~20%가 보험사기에 해당하는 부당 청구인 것으로 조사됐다. 이 경우, 예측 모델링, 신원 검색 기술, 사기 지표 규칙 엔진 등을 이용해 보험사기의 가능성을 띠는 행동과 패턴을 파악할 수 있다.   --------------------------------------------------------------- 빅 데이터 인기기사 -> 칼럼 | 빅데이터의 위력 -> 빅 데이터 구축과 활용 ‘사례 속의 교훈들’ -> 기업 미래 좌우할 빅 데이터, 어떻게 준비할 것인가? -> 빅 데이터 전문가들 ʺ잠재력은 뚜렷, 그러나 신중히 접근해야ʺ -> 블로그 | 빅데이터, 미래의 불확실성을 줄여 줄까? --------------------------------------------------------------- 보험사기 가능성을 조기에 파악하면 추가 데이터를 수집하고, 사례 관리 활동을 통해 사기일 가능성이 높은 보험 청구 사례를 면밀히 조사할 수 있다. 현재 쓰이는...

의료 사기 비정형 정형 통찰력 보험 반정형

2012.06.20

빅 데이터에 대한 공통된 정의는 없다. 그러나 일반적으로 3가지 기준 가운데 2가지에 부합하면 빅 데이터라고 일컫는다. -규모(Volume) : 대용량 데이터 세트 -속도(Velocity) : 빠른 데이터 처리 -다양성(Variety): 기업 외부에서 만들어지는 비정형, 반정형, 정형 데이터 예를 들어, 고객이 특정 기업의 CRM 시스템에 저장해둔 데이터는 정형 데이터다. 그러나 이메일과 댓글, 소셜 미디어, 동영상 콘텐츠는 정형 데이터가 아니다. 대부분의 경우, 데이터는 이 3가지 요소를 두루 갖추게 된다. 그러나 빅 데이터가 반드시 대규모일 필요는 없다는 점에 주목해야 한다. 빅 데이터에 관심을 갖는 이유는 경쟁력을 확보할 수 있기 때문이다. 예를 들어, 보험회사는 보험사기를 막고자 있지만 보험사기는 이보다 더 빠르게 증가하고 있다. 자동차 보험금의 10~20%가 보험사기에 해당하는 부당 청구인 것으로 조사됐다. 이 경우, 예측 모델링, 신원 검색 기술, 사기 지표 규칙 엔진 등을 이용해 보험사기의 가능성을 띠는 행동과 패턴을 파악할 수 있다.   --------------------------------------------------------------- 빅 데이터 인기기사 -> 칼럼 | 빅데이터의 위력 -> 빅 데이터 구축과 활용 ‘사례 속의 교훈들’ -> 기업 미래 좌우할 빅 데이터, 어떻게 준비할 것인가? -> 빅 데이터 전문가들 ʺ잠재력은 뚜렷, 그러나 신중히 접근해야ʺ -> 블로그 | 빅데이터, 미래의 불확실성을 줄여 줄까? --------------------------------------------------------------- 보험사기 가능성을 조기에 파악하면 추가 데이터를 수집하고, 사례 관리 활동을 통해 사기일 가능성이 높은 보험 청구 사례를 면밀히 조사할 수 있다. 현재 쓰이는...

2012.06.20

"하둡, 준비없는 도입은 위험" 전문가들 지적

애널리스트와 초기 사용자들의 경고는, 대다수이 데이터센터들이 하둡을 다룰만한 애널리틱스 전문가를 충분히 보유하지 못하고 있다는 것이다. 아파치.org의 하둡 사용자 리스트에는 150여 곳 이상의 기업이 등재돼 있다. JP모건을 비롯해 IBM, 구글, 부즈 앨런 앤 해밀턴, 뉴욕 타임즈 등 이름만 들어도 굵직한 기업들이다. 이 빅 데이터 관리 시스템은 이제 그야말로 열풍인 것처럼 보인다. 그러나 여러 애널리스트와 초기 사용자들은 이 오픈소스 기술을 활용하려는 움직임을 취하는데 있어 신중할 것을 요구하고 있다. 하둡의 경우 심도 깊은 훈련과 애널릭틱스 전문가를 요구하는데, 이에 대한 준비가 충분하지 않다는 이유에서다. 이 밖에 하둡 기술을 공급하는 기업들이 급증하고 있지만, 경쟁이 격화되면서 벤더 지원이 사라지는 사태를 맞이할 수도 잇다고 경고하고 있다. 하둡은 전통적인 데이터베이스 관리 시스템에 비해 확실한 우위를 지니고 있따. 특히 동영상, 오디오, 이메일과 같은 비구조적인 정보까지도 다룰 수 있는 능력이 매력적이다. 하둡 시스템은 또 비교적 간단하게 확장될 수 있다는 강점도 지닌다. 포레스터 리서치의 제임스 코빌리우스 애널리스트는 미국 기업의 1%만이 생산 환경에서 하둡을 이용하고 있을 뿐이라고 진단했다. 그는 그러나 현재 2%, 또는 3%까지 확대될 것으로 예상한다고 밝혔다. 컨커런트 컴퓨터와 이베이는 하둡을 조기에 도입한 기업 중 하나다. 이들은 특정 애플리케이션을 위해 빅 데이터 기술을 이용하고 있다. 전통적인 관계형 데이터베이스 기술도 물론 이용하고 있다. 쾨빌리우스는 이들 기업의 IT 조직이 전문 기술을 확보해감에 따라 하둡으로 더욱 많은 문제를 풀어내고 있다고 말했다. 이베이는 수천 개의 노드 상에서 하둡 기반의 클러스터에 비구조화된 데이터를 저장하고 있다. 트랜젝션 프로세싱과 같은 핵심 업무에는 관계형 데이터베이스를 이용한다. 이 회사의 경험, 검색 및 플랫폼 부사장 휴 윌리암스는 "데이터...

데이터 데이터센터 하둡 빅 데이터 비정형

2012.02.28

애널리스트와 초기 사용자들의 경고는, 대다수이 데이터센터들이 하둡을 다룰만한 애널리틱스 전문가를 충분히 보유하지 못하고 있다는 것이다. 아파치.org의 하둡 사용자 리스트에는 150여 곳 이상의 기업이 등재돼 있다. JP모건을 비롯해 IBM, 구글, 부즈 앨런 앤 해밀턴, 뉴욕 타임즈 등 이름만 들어도 굵직한 기업들이다. 이 빅 데이터 관리 시스템은 이제 그야말로 열풍인 것처럼 보인다. 그러나 여러 애널리스트와 초기 사용자들은 이 오픈소스 기술을 활용하려는 움직임을 취하는데 있어 신중할 것을 요구하고 있다. 하둡의 경우 심도 깊은 훈련과 애널릭틱스 전문가를 요구하는데, 이에 대한 준비가 충분하지 않다는 이유에서다. 이 밖에 하둡 기술을 공급하는 기업들이 급증하고 있지만, 경쟁이 격화되면서 벤더 지원이 사라지는 사태를 맞이할 수도 잇다고 경고하고 있다. 하둡은 전통적인 데이터베이스 관리 시스템에 비해 확실한 우위를 지니고 있따. 특히 동영상, 오디오, 이메일과 같은 비구조적인 정보까지도 다룰 수 있는 능력이 매력적이다. 하둡 시스템은 또 비교적 간단하게 확장될 수 있다는 강점도 지닌다. 포레스터 리서치의 제임스 코빌리우스 애널리스트는 미국 기업의 1%만이 생산 환경에서 하둡을 이용하고 있을 뿐이라고 진단했다. 그는 그러나 현재 2%, 또는 3%까지 확대될 것으로 예상한다고 밝혔다. 컨커런트 컴퓨터와 이베이는 하둡을 조기에 도입한 기업 중 하나다. 이들은 특정 애플리케이션을 위해 빅 데이터 기술을 이용하고 있다. 전통적인 관계형 데이터베이스 기술도 물론 이용하고 있다. 쾨빌리우스는 이들 기업의 IT 조직이 전문 기술을 확보해감에 따라 하둡으로 더욱 많은 문제를 풀어내고 있다고 말했다. 이베이는 수천 개의 노드 상에서 하둡 기반의 클러스터에 비구조화된 데이터를 저장하고 있다. 트랜젝션 프로세싱과 같은 핵심 업무에는 관계형 데이터베이스를 이용한다. 이 회사의 경험, 검색 및 플랫폼 부사장 휴 윌리암스는 "데이터...

2012.02.28

이제는 빅 데이터 대비할 때 • • • ‘5가지 가이드라인’

“빅 데이터(Big data)” 계획을 잘 세우고 있는가? 아직도 제대로 된 계획이 없다면 이제는 정말 차근차근 고민해봐야 할 시점이다. 빅 데이터가 미래의 핵심 전략적 사업 부문으로 일컬어지고 있다. (물론 혹자는 보는 관점에 따라 과장 선전이라고 말하기도 한다.) 이 말은 즉 고급사무실에 앉아 있는 임원들이 IT부문에게 빅 데이터에 대한 의견을 구할 날이 그저 시간문제일 뿐이라는 뜻이다. 그들에게 무슨 말을 해줘야 할까? 애널리스트들은 분명 대부분의 IT 부서들이 이미 많은 양의 데이터 처리에 어느 정도 익숙하긴 하지만, 빅 데이터는 그 이전에 하고 있는 데이터 웨어하우징(data warehousing), 데이터 마이닝(data mining), 비즈니스 인텔리전스(Business Intelligence) 분석 등과는 완전히 다르다고 지적하고 있다. 이들에 따르면 오늘날 데이터는 그 어느 때보다 빠른 속도로, 더욱 다양하게 생성되고 있으며 과거의 데이터와는 달리 대부분이 비정형(unstructured), 미가공(raw) 형태의 데이터다. 간혹 “그레이 데이터(gray data)”라고 불리기도 한다. 애널리스트들은 블로그, 소셜미디어 네트워크, 기계의 센서 및 위치기반 데이터 등과 같은 비정형 데이터가 완전히 새로운 과제를 만들어내고 있다면서, 그 데이터들을 재빨리 포착하고, 관리하고, 분석한다면 과거에는 인지할 수 없었던 사실과 패턴들을 밝혀낼 수 있을 것이라고 입을 모으고 있다.   CSC(Computer Sciences Corp.) 리딩 에지 포럼, 테크놀로지 프로그램(Leading Edge Forum, Technology Programs)의 디렉터 폴 구스타프손은 “우리는 오랫동안 데이터를 수집해왔지만, 아주 제한된 수준이었다. 많은 데이터를 생산해냈지만, 아무도 그것을 많이 활용하지 않았다. 이전에도 데이터는 보관되었고, 비즈니스 프로세스들을...

스토리지 데이터 과학자 맵리듀스 하둡 빅 데이터 비정형 그레이 노SQL

2011.12.05

“빅 데이터(Big data)” 계획을 잘 세우고 있는가? 아직도 제대로 된 계획이 없다면 이제는 정말 차근차근 고민해봐야 할 시점이다. 빅 데이터가 미래의 핵심 전략적 사업 부문으로 일컬어지고 있다. (물론 혹자는 보는 관점에 따라 과장 선전이라고 말하기도 한다.) 이 말은 즉 고급사무실에 앉아 있는 임원들이 IT부문에게 빅 데이터에 대한 의견을 구할 날이 그저 시간문제일 뿐이라는 뜻이다. 그들에게 무슨 말을 해줘야 할까? 애널리스트들은 분명 대부분의 IT 부서들이 이미 많은 양의 데이터 처리에 어느 정도 익숙하긴 하지만, 빅 데이터는 그 이전에 하고 있는 데이터 웨어하우징(data warehousing), 데이터 마이닝(data mining), 비즈니스 인텔리전스(Business Intelligence) 분석 등과는 완전히 다르다고 지적하고 있다. 이들에 따르면 오늘날 데이터는 그 어느 때보다 빠른 속도로, 더욱 다양하게 생성되고 있으며 과거의 데이터와는 달리 대부분이 비정형(unstructured), 미가공(raw) 형태의 데이터다. 간혹 “그레이 데이터(gray data)”라고 불리기도 한다. 애널리스트들은 블로그, 소셜미디어 네트워크, 기계의 센서 및 위치기반 데이터 등과 같은 비정형 데이터가 완전히 새로운 과제를 만들어내고 있다면서, 그 데이터들을 재빨리 포착하고, 관리하고, 분석한다면 과거에는 인지할 수 없었던 사실과 패턴들을 밝혀낼 수 있을 것이라고 입을 모으고 있다.   CSC(Computer Sciences Corp.) 리딩 에지 포럼, 테크놀로지 프로그램(Leading Edge Forum, Technology Programs)의 디렉터 폴 구스타프손은 “우리는 오랫동안 데이터를 수집해왔지만, 아주 제한된 수준이었다. 많은 데이터를 생산해냈지만, 아무도 그것을 많이 활용하지 않았다. 이전에도 데이터는 보관되었고, 비즈니스 프로세스들을...

2011.12.05

빅 데이터, 아태 기업들의 당면 과제로 부상

히타치데이터시스템즈(HDS)가 데이터의 폭증이라는 주제를 다루면서 아시아 기업들이 직면한 가장 큰 과제로 ‘빅 데이터 대응’을 소개했다. 히타치데이터시스템(HDS) 경영진들 : (왼쪽부터) CTO 후 요시다, 말레이시아 지사장 존슨 쿠, 아태 지사장 케빈 에글리스턴, 아태 소프트웨어 그룹 & 클라우드 솔루션 담당 이사 선일 차반 HDS의 선임 부사장이자 아시아 태평양 본부장인 케빈 에글리스턴(Kevin Eggleston)은 2011년 10월 20일 쿠알라 룸푸르(Kuala Lumpur)에서 IDC가 ‘변화하는 스토리지의 모습: 데이터를 넘어서는 전략 재고(The Changing Face of Storage: A Rethink of Strategy that Goes Beyond the Data)’라는 제목으로 발표한 최근의 지역 보고서 결과를 언급하며 성장하는 데이터를 관리하기 위해 기업들은 좀더 향상된 클라우드 테크놀로지와 솔루션을 받아들일 필요가 있다고 강조했다. 에글리스턴은 “지난 8월 연구에서 5대 주요 이슈 중 하나로 다룰 정도로 데이터의 적합성을 담보하고 데이터 성장을 관리하는 업무는 매우 중요하다. 그리고 이는 다가올 빅 데이터 트렌드를 받아들일만한 이들이 아직 소수라는 뜻이기도 하다”라고 설명했다. 에글리스턴에 다르면, 조사에 응한 기업들의 50% 이상이 비정형 데이터를 최대 고민으로 지목했다. 그는 “73%의 응답자는 점차 늘어날 비정형 데이터를 다루기 위한 전략조차 없는 상황이다. 게다가 64%는 자신들이 데이터의 연관성과 시의성, 그리고 효용을 측정하는 시스템 능력을 담보하기 위해 보다 향상된 분석 도구를 필요로 하고 있다고 답했다”라고 설명했다. 에글리스턴은 “데이터 스토리지와 활용은 재해복구와 정보 보안이라는 최우선 과제 다음으로 아태 지역에서 중요한 이슈다. 클라우드 컴퓨팅을 다...

클라우드 아태 빅 데이터 히타치데이터시스템 HDS 비정형 정형

2011.11.01

히타치데이터시스템즈(HDS)가 데이터의 폭증이라는 주제를 다루면서 아시아 기업들이 직면한 가장 큰 과제로 ‘빅 데이터 대응’을 소개했다. 히타치데이터시스템(HDS) 경영진들 : (왼쪽부터) CTO 후 요시다, 말레이시아 지사장 존슨 쿠, 아태 지사장 케빈 에글리스턴, 아태 소프트웨어 그룹 & 클라우드 솔루션 담당 이사 선일 차반 HDS의 선임 부사장이자 아시아 태평양 본부장인 케빈 에글리스턴(Kevin Eggleston)은 2011년 10월 20일 쿠알라 룸푸르(Kuala Lumpur)에서 IDC가 ‘변화하는 스토리지의 모습: 데이터를 넘어서는 전략 재고(The Changing Face of Storage: A Rethink of Strategy that Goes Beyond the Data)’라는 제목으로 발표한 최근의 지역 보고서 결과를 언급하며 성장하는 데이터를 관리하기 위해 기업들은 좀더 향상된 클라우드 테크놀로지와 솔루션을 받아들일 필요가 있다고 강조했다. 에글리스턴은 “지난 8월 연구에서 5대 주요 이슈 중 하나로 다룰 정도로 데이터의 적합성을 담보하고 데이터 성장을 관리하는 업무는 매우 중요하다. 그리고 이는 다가올 빅 데이터 트렌드를 받아들일만한 이들이 아직 소수라는 뜻이기도 하다”라고 설명했다. 에글리스턴에 다르면, 조사에 응한 기업들의 50% 이상이 비정형 데이터를 최대 고민으로 지목했다. 그는 “73%의 응답자는 점차 늘어날 비정형 데이터를 다루기 위한 전략조차 없는 상황이다. 게다가 64%는 자신들이 데이터의 연관성과 시의성, 그리고 효용을 측정하는 시스템 능력을 담보하기 위해 보다 향상된 분석 도구를 필요로 하고 있다고 답했다”라고 설명했다. 에글리스턴은 “데이터 스토리지와 활용은 재해복구와 정보 보안이라는 최우선 과제 다음으로 아태 지역에서 중요한 이슈다. 클라우드 컴퓨팅을 다...

2011.11.01

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.5