Offcanvas

���������������

"대기업 100%, 하둡 도입할 것"··· 포레스터, 5대 하둡 배포판 선정

포레스터 리서치(Forrester Research)의 빅데이터 분석가들이 내놓은 새로운 보고서에 따르면, 데이터에 대해 고급 분석을 수행하고 실용적인 시야를 얻고자 하는 조직에게 하둡 도입은 "필수"다. Credit: thinkstock 포레스터는 기업이 보유한 데이터의 60~73%가 비즈니스 인텔리전스와 분석에 사용되지 못하고 방치된다고 추산했다. 분석가 마이크 괄티에리와 노엘 유한나는 지난주 공개한 하둡 배포판에 대한 웨이브(Wave) 보고서에서 "이는 특히 고객에 대한 심층적이고 실용적인 시야가 경쟁을 위한 필수 요소인 시대에서 용납할 수 없는 수준"이라고 말했다. 또한 애플리케이션 개발자와 제공 전문가가 '일제히' 하둡을 수용 중이라면서, 대기업들은 결국 100% 하둡을 도입하게 될 것으로 예측했다. 다만 포레스터는 하둡이 복잡한 시장임을 지적했다. 그렇다면 어느 벤더를 선택해야 할까? 하둡 시장에는 절대적이고 유일한 승자는 없다. 대신 각자 강점과 서로 다른 경쟁력을 가진 벤더들이 있고 물론 특정 분야에서 자신만의 매력을 가진 벤더들도 있다. 하둡 최상위 계층에는 클라우데라(Cloudera), 호튼웍스(Hortonworks), 맵R(MapR), 그리고 IBM과 피보탈(Pivotal)이 있다. 이 5개 업체가 포레스터가 선정한 최상위 하둡 소프트웨어 배포 업체다. 포레스터는 이 업체들이 모두 보안, 스케일, 통합, 거버넌스, 성능과 같은 주요 엔터프라이즈 기능에 초점을 두고 있다고 전했다. 고객사에 배포하거나, 프라이빗 또는 퍼블릭 클라우드에 배포하고 소프트웨어 관리를 고객이 직접 하는 방법도 가능하다. 아마존 웹 서비스의 엘라스틱 맵리듀스(Elastic MapReduce) 또는 마이크로소프트 애저의 HD인사이트(HDInsight)와 같은 클라우드 기반 하둡 배포판은 고객이 자체 하드웨어에서 실행할 수 없는 퍼블릭 클라우드 전용 제품이므로 포레스터의 웨이브 보고...

BI 기업 맵R 피보탈 호튼웍스 데이터 분석 클라우데라 하둡 포레스터 IBM 배포판

2016.01.26

포레스터 리서치(Forrester Research)의 빅데이터 분석가들이 내놓은 새로운 보고서에 따르면, 데이터에 대해 고급 분석을 수행하고 실용적인 시야를 얻고자 하는 조직에게 하둡 도입은 "필수"다. Credit: thinkstock 포레스터는 기업이 보유한 데이터의 60~73%가 비즈니스 인텔리전스와 분석에 사용되지 못하고 방치된다고 추산했다. 분석가 마이크 괄티에리와 노엘 유한나는 지난주 공개한 하둡 배포판에 대한 웨이브(Wave) 보고서에서 "이는 특히 고객에 대한 심층적이고 실용적인 시야가 경쟁을 위한 필수 요소인 시대에서 용납할 수 없는 수준"이라고 말했다. 또한 애플리케이션 개발자와 제공 전문가가 '일제히' 하둡을 수용 중이라면서, 대기업들은 결국 100% 하둡을 도입하게 될 것으로 예측했다. 다만 포레스터는 하둡이 복잡한 시장임을 지적했다. 그렇다면 어느 벤더를 선택해야 할까? 하둡 시장에는 절대적이고 유일한 승자는 없다. 대신 각자 강점과 서로 다른 경쟁력을 가진 벤더들이 있고 물론 특정 분야에서 자신만의 매력을 가진 벤더들도 있다. 하둡 최상위 계층에는 클라우데라(Cloudera), 호튼웍스(Hortonworks), 맵R(MapR), 그리고 IBM과 피보탈(Pivotal)이 있다. 이 5개 업체가 포레스터가 선정한 최상위 하둡 소프트웨어 배포 업체다. 포레스터는 이 업체들이 모두 보안, 스케일, 통합, 거버넌스, 성능과 같은 주요 엔터프라이즈 기능에 초점을 두고 있다고 전했다. 고객사에 배포하거나, 프라이빗 또는 퍼블릭 클라우드에 배포하고 소프트웨어 관리를 고객이 직접 하는 방법도 가능하다. 아마존 웹 서비스의 엘라스틱 맵리듀스(Elastic MapReduce) 또는 마이크로소프트 애저의 HD인사이트(HDInsight)와 같은 클라우드 기반 하둡 배포판은 고객이 자체 하드웨어에서 실행할 수 없는 퍼블릭 클라우드 전용 제품이므로 포레스터의 웨이브 보고...

2016.01.26

빅데이터와 잘 맞는 RDBMS '스플라이스 머신'... 이유는?

스플라이스 머신의 관계형 데이터베이스 2.0 버전이 최근 소개됐는데, 이 제품은 하둡의 확장성과 스파크의 인메모리 성능을 모두 갖췄다는 것이 특징이다. 이미지 출처 : Thinkstock 스플라이스 머신(Splice Machine)이 지난 11월 17일 자사 관계형 데이터베이스 관리 시스템(RDBMS, Rational DataBase Management System) 2.0 버전을 새로이 공개했다. 스플라이스 머신의 RDBMS 솔루션은 사용자에게 직원 재교육이나 수 년 분량의 SQL 재작성 등의 번거로움 없이도 하둡의 확장성과 스파크의 성능을 누릴 수 있도록 하는 것을 목표로 한다. 스플라이스 머신의 공동 설립자이자 CEO인 몬테 츠위벤은 “우리는 이 새 버전의 RDBMS가 데이터베이스 테크놀로지의 새로운 지평을 열었다고 평가하고 있다. 단일 데이터베이스로 복합적인 워크로드를 다루는 작업은 지금까지 매우 어려운 과정이었다. 지금까지 기업들은 한 곳의 플랫폼에서 자신들의 실시간, 공동 업무 작업을 진행한 뒤 그 모든 데이터를 ETL을 통해 별도의 플랫폼으로 이전하는 과정을 거치고서야 온전한 분석, 시각 도출 작업을 진행할 수 있었다”라고 이야기했다. 츠위벤은 “이러한 구조에서 기업들은 어제의 데이터를 이용해 의사결정을 내리게 된다. 모든 것이 실시간으로 변화하는 오늘날의 비즈니스 환경에서 이는 상당히 비효율적인 방식이다”라고 지적했다. --------------------------------------------------------------- 빅데이터와 DBMS 인기기사 -> '빅데이터와 궁합 잘 맞는' 최신 데이터베이스 11선 -> '옛 것 vs. 새 것' 빅데이터가 바꿔가는 데이터베이스 지형도 -> NoSQL, 데이터베이스 시장에 '폭풍'을 몰고 오다 -> 기고 | MySQL의 8가지 단점 ...

CIO 스플라이스 머신 비용 압박 OLAP OLTP 관계형 데이터베이스 클라우데라 RDBMS 하둡 비정형 데이터 ETL 성능 인메모리 빅데이터 Splice Machine

2015.11.30

스플라이스 머신의 관계형 데이터베이스 2.0 버전이 최근 소개됐는데, 이 제품은 하둡의 확장성과 스파크의 인메모리 성능을 모두 갖췄다는 것이 특징이다. 이미지 출처 : Thinkstock 스플라이스 머신(Splice Machine)이 지난 11월 17일 자사 관계형 데이터베이스 관리 시스템(RDBMS, Rational DataBase Management System) 2.0 버전을 새로이 공개했다. 스플라이스 머신의 RDBMS 솔루션은 사용자에게 직원 재교육이나 수 년 분량의 SQL 재작성 등의 번거로움 없이도 하둡의 확장성과 스파크의 성능을 누릴 수 있도록 하는 것을 목표로 한다. 스플라이스 머신의 공동 설립자이자 CEO인 몬테 츠위벤은 “우리는 이 새 버전의 RDBMS가 데이터베이스 테크놀로지의 새로운 지평을 열었다고 평가하고 있다. 단일 데이터베이스로 복합적인 워크로드를 다루는 작업은 지금까지 매우 어려운 과정이었다. 지금까지 기업들은 한 곳의 플랫폼에서 자신들의 실시간, 공동 업무 작업을 진행한 뒤 그 모든 데이터를 ETL을 통해 별도의 플랫폼으로 이전하는 과정을 거치고서야 온전한 분석, 시각 도출 작업을 진행할 수 있었다”라고 이야기했다. 츠위벤은 “이러한 구조에서 기업들은 어제의 데이터를 이용해 의사결정을 내리게 된다. 모든 것이 실시간으로 변화하는 오늘날의 비즈니스 환경에서 이는 상당히 비효율적인 방식이다”라고 지적했다. --------------------------------------------------------------- 빅데이터와 DBMS 인기기사 -> '빅데이터와 궁합 잘 맞는' 최신 데이터베이스 11선 -> '옛 것 vs. 새 것' 빅데이터가 바꿔가는 데이터베이스 지형도 -> NoSQL, 데이터베이스 시장에 '폭풍'을 몰고 오다 -> 기고 | MySQL의 8가지 단점 ...

2015.11.30

칼럼 | 아파치 스파크에서 마음에 들지 않는 5가지

맵리듀스(MapReduce)가 점차 힘을 잃는 추세에 지난해 클라우데라(Cloudera), IBM과 같은 주요기업들의 전폭적인 투자까지 더해지며 빅데이터 프로세싱 플랫폼인 아파치 스파크(Spark)가 본궤도에 오르기 시작했다. 10줄 미만의 코드로 단어 개수를 계산하는 애플리케이션 데모들이 쏟아져 나왔다. 그러나 스파크에 대해 조금 더 깊이 파고들어 간 사람이라면 개념 설명을 위한 간단한 예제를 벗어나 본격적인 무언가를 하려고 할 때, 스파크에 대한 환상이 어느 정도 깨지는 것을 경험했을 것이다. 물론 스파크는 훌륭하다. 그러나 스파크는 스칼라(Scala) 코드 몇 줄만으로 끝나는 그런 간단한 개념이 아니다. 업무 현장에서 스파크를 사용할 때 직면하는 5가지 가장 큰 골칫거리를 살펴보자. 메모리 문제 대규모 데이터를 처리하는 도중에 힙 공간이 소진되는 스파크의 고질적인 문제를 이야기하는 것이 아니다. (스파크 1.5와 그 이후 나올 1.6에서 데이터브릭스(Databricks)의 주안점 중 하나인 프로젝트 텅스텐은 마침내 가비지 수집 문제를 많은 부분 해결해준다.) 여기서 이야기하는 문제는 대규모로 작업할 때 맞닥뜨리게 되는 다양한 형태의 메모리 문제다. 스파크를 몇 개월 동안 스탠드얼론(Standalone) 클러스터 모드로 사용하다가 YARN 및 메소스(Mesos)로 바꾸면서 모든 기본값이 변경될 때 겪는 일종의 적응 과정으로 생각할 수도 있다. 예를 들어 스탠드얼론에서는 가용한 모든 메모리와 코어를 자동으로 가져오지만, 스탠드얼론 외의 다른 구축 옵션에서는 실행 파일과 드라이버용 기본값이 터무니없이 작다. 쉽게 고칠 수 있는 문제지만 작업 규모를 확대할 때 누구나 반드시 한 번은 잊고 넘어가는 부분이다. 데모 수준을 벗어나서 대규모 데이터 세트를 다루게 될 때 스파크 작업이 꼬이는 전형적인 예를 보면 1.8TB 세트를 대상으로 실행하는 reduceByKey 작업이 spark.driver.maxResultSize의 기본값(1GB)을...

빅데이터 스파크 스트리밍 Resilient Distributed Dataset RDD 스파크 메모리 스탠드얼론 스파크 단점 스파크 스칼라 파이썬 프로그래밍 HDFS 클라우데라 IBM 개발자 개발 언어

2015.11.17

맵리듀스(MapReduce)가 점차 힘을 잃는 추세에 지난해 클라우데라(Cloudera), IBM과 같은 주요기업들의 전폭적인 투자까지 더해지며 빅데이터 프로세싱 플랫폼인 아파치 스파크(Spark)가 본궤도에 오르기 시작했다. 10줄 미만의 코드로 단어 개수를 계산하는 애플리케이션 데모들이 쏟아져 나왔다. 그러나 스파크에 대해 조금 더 깊이 파고들어 간 사람이라면 개념 설명을 위한 간단한 예제를 벗어나 본격적인 무언가를 하려고 할 때, 스파크에 대한 환상이 어느 정도 깨지는 것을 경험했을 것이다. 물론 스파크는 훌륭하다. 그러나 스파크는 스칼라(Scala) 코드 몇 줄만으로 끝나는 그런 간단한 개념이 아니다. 업무 현장에서 스파크를 사용할 때 직면하는 5가지 가장 큰 골칫거리를 살펴보자. 메모리 문제 대규모 데이터를 처리하는 도중에 힙 공간이 소진되는 스파크의 고질적인 문제를 이야기하는 것이 아니다. (스파크 1.5와 그 이후 나올 1.6에서 데이터브릭스(Databricks)의 주안점 중 하나인 프로젝트 텅스텐은 마침내 가비지 수집 문제를 많은 부분 해결해준다.) 여기서 이야기하는 문제는 대규모로 작업할 때 맞닥뜨리게 되는 다양한 형태의 메모리 문제다. 스파크를 몇 개월 동안 스탠드얼론(Standalone) 클러스터 모드로 사용하다가 YARN 및 메소스(Mesos)로 바꾸면서 모든 기본값이 변경될 때 겪는 일종의 적응 과정으로 생각할 수도 있다. 예를 들어 스탠드얼론에서는 가용한 모든 메모리와 코어를 자동으로 가져오지만, 스탠드얼론 외의 다른 구축 옵션에서는 실행 파일과 드라이버용 기본값이 터무니없이 작다. 쉽게 고칠 수 있는 문제지만 작업 규모를 확대할 때 누구나 반드시 한 번은 잊고 넘어가는 부분이다. 데모 수준을 벗어나서 대규모 데이터 세트를 다루게 될 때 스파크 작업이 꼬이는 전형적인 예를 보면 1.8TB 세트를 대상으로 실행하는 reduceByKey 작업이 spark.driver.maxResultSize의 기본값(1GB)을...

2015.11.17

이글루시큐리티, 클라우데라와 MOU 체결

이글루시큐리티가 빅데이터 분석을 위한 오픈소스 소프트웨어 전문 기업 클라우데라와 빅데이터 서비스 모델 마련 및 솔루션 개발 협력을 위한 MOU를 체결하고 유기적인 협업을 통해 관련 시장에서 서비스의 경쟁력과 안정성을 확보할 것이라고 밝혔다. 이글루시큐리티는 이번 MOU를 통해 대용량 분산 데이터 처리 기술에 대한 전문성을 확보하고, 공공, 금융, 통신, 교육 등 다양한 산업 분야에 최적화된 맞춤형 빅데이터 서비스 모델을 개발하는 등 빅데이터 사업에서 경쟁력과 안정성을 확보할 방침이다. 클라우데라는 2008년 설립된 이래 호튼웍스, 맵R과 함께 세계 3대 빅데이터 플랫폼 선도 업체로 대용량 데이터 분석·처리 및 교육·컨설팅 서비스를 기업 고객에게 제공해 왔다. 클라우데라는 다년간의 보안 솔루션 개발 및 서비스 제공 경험을 갖춘 이글루시큐리티와의 MOU 체결을 통해 한국 시장에 최적화 된 서비스 지원 체계 마련 및 신규 고객 발굴에 가속도를 붙인다는 계획이다. 이글루시큐리티 이용균 부사장은 “빅데이터 플랫폼 선도 업체인 클라우데라와의 긴밀한 협력을 통해 빅데이터 시장에서 서비스의 경쟁력과 안정성을 확보할 수 있을 것이라 기대하고 있다”며, “다년간 축적된 보안 데이터 분석 역량에 빅데이터에 대한 전문성을 더해 폭넓은 사업 기회를 창출하기 위해 주력할 것”이라고 말했다. ciokr@idg.co.kr

클라우데라 이글루시큐리티

2015.10.27

이글루시큐리티가 빅데이터 분석을 위한 오픈소스 소프트웨어 전문 기업 클라우데라와 빅데이터 서비스 모델 마련 및 솔루션 개발 협력을 위한 MOU를 체결하고 유기적인 협업을 통해 관련 시장에서 서비스의 경쟁력과 안정성을 확보할 것이라고 밝혔다. 이글루시큐리티는 이번 MOU를 통해 대용량 분산 데이터 처리 기술에 대한 전문성을 확보하고, 공공, 금융, 통신, 교육 등 다양한 산업 분야에 최적화된 맞춤형 빅데이터 서비스 모델을 개발하는 등 빅데이터 사업에서 경쟁력과 안정성을 확보할 방침이다. 클라우데라는 2008년 설립된 이래 호튼웍스, 맵R과 함께 세계 3대 빅데이터 플랫폼 선도 업체로 대용량 데이터 분석·처리 및 교육·컨설팅 서비스를 기업 고객에게 제공해 왔다. 클라우데라는 다년간의 보안 솔루션 개발 및 서비스 제공 경험을 갖춘 이글루시큐리티와의 MOU 체결을 통해 한국 시장에 최적화 된 서비스 지원 체계 마련 및 신규 고객 발굴에 가속도를 붙인다는 계획이다. 이글루시큐리티 이용균 부사장은 “빅데이터 플랫폼 선도 업체인 클라우데라와의 긴밀한 협력을 통해 빅데이터 시장에서 서비스의 경쟁력과 안정성을 확보할 수 있을 것이라 기대하고 있다”며, “다년간 축적된 보안 데이터 분석 역량에 빅데이터에 대한 전문성을 더해 폭넓은 사업 기회를 창출하기 위해 주력할 것”이라고 말했다. ciokr@idg.co.kr

2015.10.27

한 인텔 임원이 설명하는 '빅데이터 난관 2가지'

기업들의 화끈한 투자 덕택에 빅데이터 분석 툴과 엔지니어링 테크닉 시장은 어느덧 수 백 억 달러 규모로 성장했다. 그러나 기업들에게 그렇게 수집한 데이터를 어떻게 활용하는지를 물어보면, 멀쩡한 대답이 돌아오지 않는 경우가 아직도 흔하다. 인텔의 부사장 겸 클라우드 플랫폼 그룹 총괄 매니저인 제이슨 왁스먼은 지난 주 투자자들을 대상으로 진행된 웹케스트에서 “많은 이들이 빅데이터 안에 숨겨진 이 불편한 진실을 알아차리지 못하고 있다. 쓰지도 못할 데이터를 왜 모으는 것인가?”라는 질문을 던졌다. 왁스먼은 “물론 기업들은 나름의 빅데이터 전략을 가지고 있고, 그에 기반해 좋은 수집, 사용 방안들을 갖추고 있다. 핵심은 단순하게 그 데이터를 ‘사용’하는지의 여부가 아닌 그 곳에서 어떤 ‘시각’을 뽑아내는지의 문제다. 이는 생각보다 힘든 과제다”라고 설명했다. 빅데이터는 대규모의 센서, 프로세스 데이터를 수집해 분석함으로써 고객 행동 양식에 대한 시각이나 운영 효율성을 개선할 방향 등을 이끌어내는 일련의 과정을 포괄하는 용어다. 인텔은 빅데이터 시스템이 대규모의 프로세서 주도적 하드웨어를 필요로 하게 될 것이고, 해당 분야에서 자신들의 강점을 내세울 수 있을 것으로 기대하고 있다. 현재 빅데이터 관련 IT 지출 규모는 연 130억 달러 수준이며, 인텔은 이 규모가 2018년이면 410억 달러 수준까지 성장할 것으로, 그리고 그 가운데 하드웨어 관련 시장 규모는 20억 달러 수준을 구성할 것으로 내다본다. 왁스먼은 기업들이 빅데이터의 가치를 온전히 발굴하기 위해선 넘어서야 할 몇 가지 과제가 존재한다고 설명했다. 그에 따르면 기업들의 빅데이터 활용 경향과 향후 가능한 활용 방향을 이해하기 위해 인텔은 다양한 기업들과 대화를 나눴다. 기업들이 가장 고민하는 문제는 빅데이터에서 어떻게 가치를 끌어낼 지였다. 왁스먼은 이는 결코 쉽지 않은 과...

클라우드 빅데이터 데이터 과학자 클라우데라

2015.09.01

기업들의 화끈한 투자 덕택에 빅데이터 분석 툴과 엔지니어링 테크닉 시장은 어느덧 수 백 억 달러 규모로 성장했다. 그러나 기업들에게 그렇게 수집한 데이터를 어떻게 활용하는지를 물어보면, 멀쩡한 대답이 돌아오지 않는 경우가 아직도 흔하다. 인텔의 부사장 겸 클라우드 플랫폼 그룹 총괄 매니저인 제이슨 왁스먼은 지난 주 투자자들을 대상으로 진행된 웹케스트에서 “많은 이들이 빅데이터 안에 숨겨진 이 불편한 진실을 알아차리지 못하고 있다. 쓰지도 못할 데이터를 왜 모으는 것인가?”라는 질문을 던졌다. 왁스먼은 “물론 기업들은 나름의 빅데이터 전략을 가지고 있고, 그에 기반해 좋은 수집, 사용 방안들을 갖추고 있다. 핵심은 단순하게 그 데이터를 ‘사용’하는지의 여부가 아닌 그 곳에서 어떤 ‘시각’을 뽑아내는지의 문제다. 이는 생각보다 힘든 과제다”라고 설명했다. 빅데이터는 대규모의 센서, 프로세스 데이터를 수집해 분석함으로써 고객 행동 양식에 대한 시각이나 운영 효율성을 개선할 방향 등을 이끌어내는 일련의 과정을 포괄하는 용어다. 인텔은 빅데이터 시스템이 대규모의 프로세서 주도적 하드웨어를 필요로 하게 될 것이고, 해당 분야에서 자신들의 강점을 내세울 수 있을 것으로 기대하고 있다. 현재 빅데이터 관련 IT 지출 규모는 연 130억 달러 수준이며, 인텔은 이 규모가 2018년이면 410억 달러 수준까지 성장할 것으로, 그리고 그 가운데 하드웨어 관련 시장 규모는 20억 달러 수준을 구성할 것으로 내다본다. 왁스먼은 기업들이 빅데이터의 가치를 온전히 발굴하기 위해선 넘어서야 할 몇 가지 과제가 존재한다고 설명했다. 그에 따르면 기업들의 빅데이터 활용 경향과 향후 가능한 활용 방향을 이해하기 위해 인텔은 다양한 기업들과 대화를 나눴다. 기업들이 가장 고민하는 문제는 빅데이터에서 어떻게 가치를 끌어낼 지였다. 왁스먼은 이는 결코 쉽지 않은 과...

2015.09.01

"빅데이터 여정에 동참하세요" IDG 벤치마킹 세미나 개최

‘엔드 투 엔드 하둡’을 주제로 한 IDG 벤치마킹 세미나가 7월 16일 목요일 저녁에 열렸다. 이 세미나는 델코리아와 클라우데라코리아가 후원했으며 여기에는 금융, 소비재, 공공, 통신, 전자, 전기, 석유/화학 등의 기업에 종사하는 IT담당 실무자와 전문가 등 50여 명이 참석했다. ‘빅데이터 into 빅인사이트 : 하둡기반 빅데이터 토털 솔루션’이라는 이름으로 열린 이 세미나에서 클라우데라코리아 강형준 지사장이 간략한 회사 소개와 함께 “그동안 낭비되거나 버려졌던 데이터를 모아 비즈니스 인사이트를 얻도록 기업을 도울 수 있다”며 “그럴려면 오픈소스가 아닌 오픈 스탠다드(개방형 표준)를 지향해야 한다”고 강조했다. 이어서 델코리아의 최영복 이사는 자사 조사 자료를 인용하며 “어떤 데이터가 회사에 있는지 안다고 한 응답자는 61%지만 그 데이터에서 가치를 추구하는 회사는 24%에 불과하다”며 “빅데이터를 단기 프로젝트로 보지 말고 긴 여정이라고 생가하고 접근하라”고 당부했다. 두 회사의 발표가 끝난 후 참석자들의 질의응답이 이어졌다. 현대오토에버의 김수연 대리는 보안에 빅데이터 분석을 활용한 사례가 있는지 질문했으며 또다른 참석자는 “이제 막 빅데이터에 대해 학습하는 단계인데 도움을 받고 싶다”고 말했다. 특히 이 세미나에는 빅데이터에 대해 고민하고 작게나마 관련 프로젝트를 검토하는 기업들이 참석해 실질적인 고민을 나눌 수 있었다. ciokr@idg.co.kr  

오픈소스 빅데이터 하둡 클라우데라 벤치마킹 세미나

2015.07.17

‘엔드 투 엔드 하둡’을 주제로 한 IDG 벤치마킹 세미나가 7월 16일 목요일 저녁에 열렸다. 이 세미나는 델코리아와 클라우데라코리아가 후원했으며 여기에는 금융, 소비재, 공공, 통신, 전자, 전기, 석유/화학 등의 기업에 종사하는 IT담당 실무자와 전문가 등 50여 명이 참석했다. ‘빅데이터 into 빅인사이트 : 하둡기반 빅데이터 토털 솔루션’이라는 이름으로 열린 이 세미나에서 클라우데라코리아 강형준 지사장이 간략한 회사 소개와 함께 “그동안 낭비되거나 버려졌던 데이터를 모아 비즈니스 인사이트를 얻도록 기업을 도울 수 있다”며 “그럴려면 오픈소스가 아닌 오픈 스탠다드(개방형 표준)를 지향해야 한다”고 강조했다. 이어서 델코리아의 최영복 이사는 자사 조사 자료를 인용하며 “어떤 데이터가 회사에 있는지 안다고 한 응답자는 61%지만 그 데이터에서 가치를 추구하는 회사는 24%에 불과하다”며 “빅데이터를 단기 프로젝트로 보지 말고 긴 여정이라고 생가하고 접근하라”고 당부했다. 두 회사의 발표가 끝난 후 참석자들의 질의응답이 이어졌다. 현대오토에버의 김수연 대리는 보안에 빅데이터 분석을 활용한 사례가 있는지 질문했으며 또다른 참석자는 “이제 막 빅데이터에 대해 학습하는 단계인데 도움을 받고 싶다”고 말했다. 특히 이 세미나에는 빅데이터에 대해 고민하고 작게나마 관련 프로젝트를 검토하는 기업들이 참석해 실질적인 고민을 나눌 수 있었다. ciokr@idg.co.kr  

2015.07.17

기업 7곳의 '인텔·클라우데라' 하둡 솔루션 활용법

인텔이 지난 5월 개최한 애널리틱스 데이(Analytics Day)는 인텔과 클라우데라의 파트너십 체결 1주년을 축하하는 자리이기도 했다. 인텔의 선입 부회장이자 데이터 센터 그룹 전무이사 다이앤 브라이언트와 클라우데라의 CEO 톰 오라일리는 이곳에서 인텔 프로세서와 클라우데라의 CDH를 활용해 비즈니스를 변혁시키고 있는 빅데이터 활용 사례 7곳을 소개했다. --------------------------------------------------------------- 빅 데이터 사례 ->에어비앤비·스타벅스·소닉이 말하는 '빅데이터 성공 비밀' -> 월마트의 쇼핑 2.0 실험 '소셜, 모바일, 애널리틱스' ->영화 ‘머니볼’에서 배우는 BI 애널리틱스 교훈 -> 빅 데이터 구축과 활용 ‘사례 속의 교훈들 -> 현실화되는 마이너리티 리포트 ‘예언자는 애널리틱스’ -> 블로그 | 예측 분석이 CRM에 미치는 영향 -> “블로그 | 돈 버는 빅 데이터 이야기” --------------------------------------------------------------- ciokr@idg.co.kr

인텔 빅데이터 하둡 클라우데라 분석 CDH

2015.07.08

인텔이 지난 5월 개최한 애널리틱스 데이(Analytics Day)는 인텔과 클라우데라의 파트너십 체결 1주년을 축하하는 자리이기도 했다. 인텔의 선입 부회장이자 데이터 센터 그룹 전무이사 다이앤 브라이언트와 클라우데라의 CEO 톰 오라일리는 이곳에서 인텔 프로세서와 클라우데라의 CDH를 활용해 비즈니스를 변혁시키고 있는 빅데이터 활용 사례 7곳을 소개했다. --------------------------------------------------------------- 빅 데이터 사례 ->에어비앤비·스타벅스·소닉이 말하는 '빅데이터 성공 비밀' -> 월마트의 쇼핑 2.0 실험 '소셜, 모바일, 애널리틱스' ->영화 ‘머니볼’에서 배우는 BI 애널리틱스 교훈 -> 빅 데이터 구축과 활용 ‘사례 속의 교훈들 -> 현실화되는 마이너리티 리포트 ‘예언자는 애널리틱스’ -> 블로그 | 예측 분석이 CRM에 미치는 영향 -> “블로그 | 돈 버는 빅 데이터 이야기” --------------------------------------------------------------- ciokr@idg.co.kr

2015.07.08

로그 관리, 빅데이터 활용 사례 주도

빅데이터 솔루션을 도입한 기업들이 로그 관리에 이를 활용하는 것으로 조사됐다. 이러한 보안 활용사례는 데이터 아카이빙, 운영 데이터 저장, 고급 분석, 데이터 발견, 데이터 검색으로 이어졌다. 이미지 출처 : Thinkstock SANS인스티튜트가 IT, 보안, 컴플라이언스의 전문가 200명 이상을 대상으로 조사한 결과, 빅데이터 프로젝트를 도입한 기업의 55% 가운데 절반 이상은 로그 관리에 이 기술을 사용하는 것으로 파악됐다. 또 향후 2년간 빅데이터를 도입할 계획이라고 밝힌 기업 가운데 58%는 로그 관리를 최우선순위에 둔다고 답했다. SANS 조사를 후원한 클라우데라의 보안센터 이사인 샘 헤이우드는 “로그 데이터, 침입 경보, 다른 유형의 보안 관련 정보는 빅데이터 시스템에 가장 잘 맞는다”고 말했다. 빅데이터는 대용량이면서, 다양한 유형에서 발생하며, 빠른 속도로 늘어나고 있다. "우리는 하루에도 수 억 건의 보안 사고를 처리하는 기업들에게 이야기하고 있다. 그리고 기업은 센서 그리드의 여러 접점에서 데이터를 끌어 오고 있다. 모든 로그 파일은 다르게 보이며, 펌웨어 업데이트가 일어나면서 하나의 시스템은 반송 데이터를 변경할 것이다”라고 헤이우드는 전했다. 이 정보를 수집하는 기존의 접근 방식은 분석가들이 보안 사고 분석을 시작하기 전에 데이터를 컴파일하는데 며칠이나 몇 주를 보내야 함을 의미한다. 빅데이터는 이 데이터를 수집하는데 비용 효율적이고 확장 가능한 플랫폼뿐 아니라, 전통적인 규칙 기반 및 시그니처 기반 접근 방식으로 감지되지 않을 수 있는 장기적이고 미묘한 패턴을 찾는 분석 툴까지도 제공해 준다. "우리는 사이버보안에서 빅데이터를 크게 사용한다는 것을 알고 있었지만 이렇게까지 크게 사용하는지는 몰랐다"고 헤이우드는 말했다. SANS 조사에서 빅데이터 시스템에 어떤 유형에 데이터가 저장돼 있으며 한 두 가지 형태의 민감한 데이터로 ...

CSO 빅데이터 조사 CISO 클라우데라 로그 관리 SANS인스티튜트

2015.06.16

빅데이터 솔루션을 도입한 기업들이 로그 관리에 이를 활용하는 것으로 조사됐다. 이러한 보안 활용사례는 데이터 아카이빙, 운영 데이터 저장, 고급 분석, 데이터 발견, 데이터 검색으로 이어졌다. 이미지 출처 : Thinkstock SANS인스티튜트가 IT, 보안, 컴플라이언스의 전문가 200명 이상을 대상으로 조사한 결과, 빅데이터 프로젝트를 도입한 기업의 55% 가운데 절반 이상은 로그 관리에 이 기술을 사용하는 것으로 파악됐다. 또 향후 2년간 빅데이터를 도입할 계획이라고 밝힌 기업 가운데 58%는 로그 관리를 최우선순위에 둔다고 답했다. SANS 조사를 후원한 클라우데라의 보안센터 이사인 샘 헤이우드는 “로그 데이터, 침입 경보, 다른 유형의 보안 관련 정보는 빅데이터 시스템에 가장 잘 맞는다”고 말했다. 빅데이터는 대용량이면서, 다양한 유형에서 발생하며, 빠른 속도로 늘어나고 있다. "우리는 하루에도 수 억 건의 보안 사고를 처리하는 기업들에게 이야기하고 있다. 그리고 기업은 센서 그리드의 여러 접점에서 데이터를 끌어 오고 있다. 모든 로그 파일은 다르게 보이며, 펌웨어 업데이트가 일어나면서 하나의 시스템은 반송 데이터를 변경할 것이다”라고 헤이우드는 전했다. 이 정보를 수집하는 기존의 접근 방식은 분석가들이 보안 사고 분석을 시작하기 전에 데이터를 컴파일하는데 며칠이나 몇 주를 보내야 함을 의미한다. 빅데이터는 이 데이터를 수집하는데 비용 효율적이고 확장 가능한 플랫폼뿐 아니라, 전통적인 규칙 기반 및 시그니처 기반 접근 방식으로 감지되지 않을 수 있는 장기적이고 미묘한 패턴을 찾는 분석 툴까지도 제공해 준다. "우리는 사이버보안에서 빅데이터를 크게 사용한다는 것을 알고 있었지만 이렇게까지 크게 사용하는지는 몰랐다"고 헤이우드는 말했다. SANS 조사에서 빅데이터 시스템에 어떤 유형에 데이터가 저장돼 있으며 한 두 가지 형태의 민감한 데이터로 ...

2015.06.16

"하둡은 사라진다" 데이터 인프라로 통합될 전망... 클라우데라 창업자

지난 몇 년 간 클라우드와 모바일와 더불어 크게 주목받은 하둡과 빅데이터가 변화하고 있다는 주장이 제기됐다. 뉴욕에서 개최된 세계 최대 빅데이터 행사인 ‘오라일리 스트라타 컨퍼런스 + 하둡 월드(O'Reilly Strata Conference + Hadoop World)’에서 기조 연설자로 나선 클라우데라 공동창업자인 마이크 올슨은 “행사에 적절한 발언은 아니지만, 올해 하둡이 사라진다고 내다본다”고 말했다. 올슨이 ‘제 1회 하둡 월드 2009(2012년부터 오라일리 스트라타 컨퍼런스와 병합됐다)’에서 연설자로 나선 당시 관객 규모는 400명 수준에 불과했다. 그로부터 6년이 지난 이번 행사의 관객석은 5,000석을 훌쩍 넘는 등 하둡에 대한 전세계적인 관심이 높아지고 있는 상황이다. ‘하둡의 종말’에 대해 언급한 이유에 대해, 올슨은 ”하둡 월드에서 처음으로 기조 연설자로 나섰을 때만 하더라도, 아파치 하둡(Apache Hadoop)의 로고인 ‘노란 코끼리’에 대해 아는 사람은 없었다”며, “지난 몇 년 간은 하둡 개발자 프로젝트가 무엇인지에 대한 이야기를 나눴다면, 이제 이 프로젝트가 무엇을 하는지에 대한 논의가 필요하다”고 설명했다. 이 때문에 올슨은 하둡이 올해 ‘사라진다’고 표현한 것이다. 하둡은 데이터를 분석하는 애플리케이션이 탑재된 데이터 인프라의 기초가 될 전망이다. 올슨은 “대다수 기업 고객은 데이터가 테라데이타 엔터프라이즈 데이터 웨어하우스(EDW)인지, 오라클 데이터베이스인지에 대해서는 신경쓰지 않는다”며, “하둡이라면 진정한 의미의 데이터 인프라를 만들 수 있을 것”이라고 말했다. “테라데이타, EMC, 오라클 그리고 나머지 데이터베이스는 실제로도 사라지고 있다”며,...

CIO 빅데이터 데이터베이스 하둡 클라우데라 EDW

2014.10.17

지난 몇 년 간 클라우드와 모바일와 더불어 크게 주목받은 하둡과 빅데이터가 변화하고 있다는 주장이 제기됐다. 뉴욕에서 개최된 세계 최대 빅데이터 행사인 ‘오라일리 스트라타 컨퍼런스 + 하둡 월드(O'Reilly Strata Conference + Hadoop World)’에서 기조 연설자로 나선 클라우데라 공동창업자인 마이크 올슨은 “행사에 적절한 발언은 아니지만, 올해 하둡이 사라진다고 내다본다”고 말했다. 올슨이 ‘제 1회 하둡 월드 2009(2012년부터 오라일리 스트라타 컨퍼런스와 병합됐다)’에서 연설자로 나선 당시 관객 규모는 400명 수준에 불과했다. 그로부터 6년이 지난 이번 행사의 관객석은 5,000석을 훌쩍 넘는 등 하둡에 대한 전세계적인 관심이 높아지고 있는 상황이다. ‘하둡의 종말’에 대해 언급한 이유에 대해, 올슨은 ”하둡 월드에서 처음으로 기조 연설자로 나섰을 때만 하더라도, 아파치 하둡(Apache Hadoop)의 로고인 ‘노란 코끼리’에 대해 아는 사람은 없었다”며, “지난 몇 년 간은 하둡 개발자 프로젝트가 무엇인지에 대한 이야기를 나눴다면, 이제 이 프로젝트가 무엇을 하는지에 대한 논의가 필요하다”고 설명했다. 이 때문에 올슨은 하둡이 올해 ‘사라진다’고 표현한 것이다. 하둡은 데이터를 분석하는 애플리케이션이 탑재된 데이터 인프라의 기초가 될 전망이다. 올슨은 “대다수 기업 고객은 데이터가 테라데이타 엔터프라이즈 데이터 웨어하우스(EDW)인지, 오라클 데이터베이스인지에 대해서는 신경쓰지 않는다”며, “하둡이라면 진정한 의미의 데이터 인프라를 만들 수 있을 것”이라고 말했다. “테라데이타, EMC, 오라클 그리고 나머지 데이터베이스는 실제로도 사라지고 있다”며,...

2014.10.17

기고 | 하둡 배포판 3종의 현재와 미래

하둡(Hadoop)은 방대한 데이터 세트를 간단히 분석할 수 있는 새로운 방법을 제시하면서, 빅 데이터 시장을 순식간에 탈바꿈시켰다. 최근 하둡과 빅 데이터가 동의어로 사용되는 경우가 많은 이유다. 하둡은 오픈소스 프로젝트다. 따라서 많은 벤더들이 새 기능을 추가하거나 코드 기반을 개선하는 방식으로 독자적인 배포판(distributions)을 개발해 공급하고 있다. 빅 데이터 전문 기업 알토로스(Altoros)가 작성한 이번 기사는 하둡 표준판과의 차이와 함께 중요 배포판을 개략적으로 설명하고 있다. 표준 오픈소스 하둡 배포판(아파치 하둡)에는 다음이 포함되어 있다. - 병렬 컴퓨팅을 실행시키는 하둡 맵리듀스(MapReduce) - 하둡 분산형 파일 시스템(HDFS: Hadoop Distributed File System) - 다른 하둡 모듈이 사용하는 유틸리티와 라이브러리 세트인 하둡 커먼(Hadoop Common). 이들는 하둡의 기본 구성 요소에 불과하다. 이 밖에 특정 작업을 처리하고, 연산 속도를 높이고, 반복 작업을 최적화하는데 많이 쓰이는 아파치 하이브(Apache Hive), 아파치 피그(Apache Pig), 아파치 주키퍼(Apache Zookeeper) 등 다른 솔루션들도 있다. 벤더 배포판은 대개 오픈소스의 문제를 극복하고, 고객에게 추가적인 가치를 제공하기 위해 설계됐다. 특히 다음에 중점을 두고 있다. - 신뢰성. 벤더들은 버그가 발견됐을 때 더 빨리 대응을 한다. 즉시 픽스와 패치를 배포해, 솔루션을 더 안정적으로 만든다. - 지원. 기업 사명 달성에 아주 중요한 플랫폼 도입과 엔터프라이즈급 작업 처리가 가능하도록 기술 지원 서비스를 제공하는 회사들이 많다. - 완성도. 특정 작업을 처리하기 위해, 다른 툴로 기능을 보강한 하둡 배포판이 아주 많다. 여기에 더해, 벤더들은 하둡 표준 배포판을 개선하는데 공헌하고 있다. 오픈소스 저장소에 업데이트한 코드를...

하둡 클라우데라 호튼웍스 맵알 하둡 2.0. 배포판

2014.07.01

하둡(Hadoop)은 방대한 데이터 세트를 간단히 분석할 수 있는 새로운 방법을 제시하면서, 빅 데이터 시장을 순식간에 탈바꿈시켰다. 최근 하둡과 빅 데이터가 동의어로 사용되는 경우가 많은 이유다. 하둡은 오픈소스 프로젝트다. 따라서 많은 벤더들이 새 기능을 추가하거나 코드 기반을 개선하는 방식으로 독자적인 배포판(distributions)을 개발해 공급하고 있다. 빅 데이터 전문 기업 알토로스(Altoros)가 작성한 이번 기사는 하둡 표준판과의 차이와 함께 중요 배포판을 개략적으로 설명하고 있다. 표준 오픈소스 하둡 배포판(아파치 하둡)에는 다음이 포함되어 있다. - 병렬 컴퓨팅을 실행시키는 하둡 맵리듀스(MapReduce) - 하둡 분산형 파일 시스템(HDFS: Hadoop Distributed File System) - 다른 하둡 모듈이 사용하는 유틸리티와 라이브러리 세트인 하둡 커먼(Hadoop Common). 이들는 하둡의 기본 구성 요소에 불과하다. 이 밖에 특정 작업을 처리하고, 연산 속도를 높이고, 반복 작업을 최적화하는데 많이 쓰이는 아파치 하이브(Apache Hive), 아파치 피그(Apache Pig), 아파치 주키퍼(Apache Zookeeper) 등 다른 솔루션들도 있다. 벤더 배포판은 대개 오픈소스의 문제를 극복하고, 고객에게 추가적인 가치를 제공하기 위해 설계됐다. 특히 다음에 중점을 두고 있다. - 신뢰성. 벤더들은 버그가 발견됐을 때 더 빨리 대응을 한다. 즉시 픽스와 패치를 배포해, 솔루션을 더 안정적으로 만든다. - 지원. 기업 사명 달성에 아주 중요한 플랫폼 도입과 엔터프라이즈급 작업 처리가 가능하도록 기술 지원 서비스를 제공하는 회사들이 많다. - 완성도. 특정 작업을 처리하기 위해, 다른 툴로 기능을 보강한 하둡 배포판이 아주 많다. 여기에 더해, 벤더들은 하둡 표준 배포판을 개선하는데 공헌하고 있다. 오픈소스 저장소에 업데이트한 코드를...

2014.07.01

맵알, 11억 달러 투자 유치··· 하둡 기업들 '연이은 낭보'

아파치 하둡 빅 데이터 관리 오픈소스 프로젝트에 기반한 상용 소프트웨어 플랫폼 공급 기업 맵알(MapR)이 11억 달러의 투자금을 확보했다. 이 중 8억 달러는 구글이 투자한 것이다. 올해 하둡 관련 기업에는 방대한 투자금이 집중되고 있다. 맵알 경쟁 기업이 호톤웍스와 클라우드데라도 올해 성공적으로 투자금을 유치한 바 있다. 맵알의 상용 패키지는 아파치 하둡을 구내형(on premises)으로 구동할 수 있도록 지원한다. 이는 구글 및 아마존의 방식과 다른데, 이들의 경우 호스트 방식으로 하둡 솔루션을 제공하고 있기 때문이다. 포레스터가 톱9 하둡 기업을 평가한 최근 보고서에 따르면 맵알의 솔루션은 업계 최상급 수준의 인정을 받고 있다. 회사의 데이터 아키텍처 및 프로세싱 능력 덕분이었다. 구글외에 투자에 참여한 기관으로는 퀄컴 벤처스, 라이트스피드 벤처 파트너, 메이필드 펀드, NEA, 레드포인트 벤처드 등이 있었다. 맵알은 이번 투자금을 제품 개발 및 글로벌 시장 공략에 활용할 계획이라고 밝혔다. 지난 3월 클라우데라는 총 9억 달러에 이르는 투자 유치를 발표한 바 있으며, 호톤웍스 또한 지난 3월 1억 달러의 투자금 확보를 발표했었다. ciokr@idg.co.kr

구글 유치 투자 하둡 클라우데라 맵알 호톤웍스

2014.07.01

아파치 하둡 빅 데이터 관리 오픈소스 프로젝트에 기반한 상용 소프트웨어 플랫폼 공급 기업 맵알(MapR)이 11억 달러의 투자금을 확보했다. 이 중 8억 달러는 구글이 투자한 것이다. 올해 하둡 관련 기업에는 방대한 투자금이 집중되고 있다. 맵알 경쟁 기업이 호톤웍스와 클라우드데라도 올해 성공적으로 투자금을 유치한 바 있다. 맵알의 상용 패키지는 아파치 하둡을 구내형(on premises)으로 구동할 수 있도록 지원한다. 이는 구글 및 아마존의 방식과 다른데, 이들의 경우 호스트 방식으로 하둡 솔루션을 제공하고 있기 때문이다. 포레스터가 톱9 하둡 기업을 평가한 최근 보고서에 따르면 맵알의 솔루션은 업계 최상급 수준의 인정을 받고 있다. 회사의 데이터 아키텍처 및 프로세싱 능력 덕분이었다. 구글외에 투자에 참여한 기관으로는 퀄컴 벤처스, 라이트스피드 벤처 파트너, 메이필드 펀드, NEA, 레드포인트 벤처드 등이 있었다. 맵알은 이번 투자금을 제품 개발 및 글로벌 시장 공략에 활용할 계획이라고 밝혔다. 지난 3월 클라우데라는 총 9억 달러에 이르는 투자 유치를 발표한 바 있으며, 호톤웍스 또한 지난 3월 1억 달러의 투자금 확보를 발표했었다. ciokr@idg.co.kr

2014.07.01

빅 데이터 거물들의 공조··· 클라우데라·몽고DB, 전략적 제휴 발표

빅 데이터 애플리케이션에 힘을 더해주는 인프라스트럭처와 관련해, 기업/기관들이 허둥대는 양상이라고 몽고DB의 마케팅 및 비즈니그 개발 & 기업 전략 부문 부사장 매트 아샤가 진단했다. 아샤는 "빅 데이터가 중요하다는 점은 잘 알고 있다. 업계에서 진행 중인 일을 읽고 파악하고 있다. 그러나 대다수는 자신이 무엇을 해야하는지 알지 못하고 있다"라고 말했다. 그는 이어 이러한 혼란에는 방대한 솔루션의 존재도 한몫한다고 평가했다. 어지러울 정도로 많은 신규 데이터 인스프라스트럭처 기술들이 존재하며 이로 인해 이들을 어떻게 조합해야할 지 파악하기 어렵다는 설명이다. 클라우드데라 하둡 배포판과 몽고DB의 긴밀한 결합 몽고DB와 클라우데라는 이러한 혼동 상황을 도전이자 기회로 파악하고 있다. 이들 두 기업은 지난 29일 전략적 파트너십을 발표했는데, 이는 가장 널리 채택된 NoSQL 데이터베이스와 가장 널리 채택된 하둡 배포판 사이의 긴밀한 결합을 보장하겠다는 것이 골자다. 아샤는 "양사는 보완적인 메시지를 보유하고 있다. 그러나 많은 이들이 몽고DB와 하둡을 경쟁관계로 간주하고 있다. 어떤 기술이나 기술 세트가 자신의 비즈니스 문제를 해결하는데 사용할 수 있는지 이해할 수 있도록, 양사는 지름길을 제공하고자 한다"라고 말했다. 아샤와 클라우데라 ISV 얼라이언스 프로그램 디렉터 유리 부칸은 양사가 공조를 통해 기업들이 장기적이면서도 성공적인 빅 데이터 전략을 마련할 수 있도록 도울 것이라고 강조했다. 이들에 따르면, 하둡의 데이터 관리 기능만을 필요로 하는 기업이 있는가 하면, NoSQL 데이터베이스의 운용 데이터 스토어가 필요한 경우도 있다. 그리고 점차 많은 애플리케이션들이이들의 공조를 요구하고 있다. 불칸은 "기술적 관점에서 양사는 이러한 통합을 추구하기로 했다. 달성하고자 하는 바는 데이터를 하둡에 삽입하고 분석하고 통찰을 얻어낼 수 있도록 함으로써 운영 데이터 스토어를 ...

제휴 빅 데이터 클라우데라 몽고DB

2014.04.30

빅 데이터 애플리케이션에 힘을 더해주는 인프라스트럭처와 관련해, 기업/기관들이 허둥대는 양상이라고 몽고DB의 마케팅 및 비즈니그 개발 & 기업 전략 부문 부사장 매트 아샤가 진단했다. 아샤는 "빅 데이터가 중요하다는 점은 잘 알고 있다. 업계에서 진행 중인 일을 읽고 파악하고 있다. 그러나 대다수는 자신이 무엇을 해야하는지 알지 못하고 있다"라고 말했다. 그는 이어 이러한 혼란에는 방대한 솔루션의 존재도 한몫한다고 평가했다. 어지러울 정도로 많은 신규 데이터 인스프라스트럭처 기술들이 존재하며 이로 인해 이들을 어떻게 조합해야할 지 파악하기 어렵다는 설명이다. 클라우드데라 하둡 배포판과 몽고DB의 긴밀한 결합 몽고DB와 클라우데라는 이러한 혼동 상황을 도전이자 기회로 파악하고 있다. 이들 두 기업은 지난 29일 전략적 파트너십을 발표했는데, 이는 가장 널리 채택된 NoSQL 데이터베이스와 가장 널리 채택된 하둡 배포판 사이의 긴밀한 결합을 보장하겠다는 것이 골자다. 아샤는 "양사는 보완적인 메시지를 보유하고 있다. 그러나 많은 이들이 몽고DB와 하둡을 경쟁관계로 간주하고 있다. 어떤 기술이나 기술 세트가 자신의 비즈니스 문제를 해결하는데 사용할 수 있는지 이해할 수 있도록, 양사는 지름길을 제공하고자 한다"라고 말했다. 아샤와 클라우데라 ISV 얼라이언스 프로그램 디렉터 유리 부칸은 양사가 공조를 통해 기업들이 장기적이면서도 성공적인 빅 데이터 전략을 마련할 수 있도록 도울 것이라고 강조했다. 이들에 따르면, 하둡의 데이터 관리 기능만을 필요로 하는 기업이 있는가 하면, NoSQL 데이터베이스의 운용 데이터 스토어가 필요한 경우도 있다. 그리고 점차 많은 애플리케이션들이이들의 공조를 요구하고 있다. 불칸은 "기술적 관점에서 양사는 이러한 통합을 추구하기로 했다. 달성하고자 하는 바는 데이터를 하둡에 삽입하고 분석하고 통찰을 얻어낼 수 있도록 함으로써 운영 데이터 스토어를 ...

2014.04.30

인텔, 클라우데라에 투자 "회사 역사상 동종 최대 규모"

인텔이 분산형 컴퓨팅 소프트웨어 기업 클라우데라에 투자한다. 회사의 x86 프로세서에 맞춰 하둡 소프트웨어를 튜닝하기 위한 목적이다. 회사는 클라우데라에의 투자금 규모에 대해서는 언급하지 않으면서도 '상당한' 규모라고 표현했다. 클라우데라는 대규모 데이터가 여러 컴퓨팅 리소스를 가로질러 처리할 수 있도록 하는 소프트웨어 도구를 개발하고 있다. 회사의 제품군은 오픈소스 소프트웨어 하둡에 기반하고 있다. 인텔은 성명서를 통해 "회사 역사상 데이터센터 기술 투자 중 최대 규모"라고 밝혔다. 프로세서, 마더보드, 네트워킹 스위치 등의 데이터센터용 하드웨어를 만들고 있는 인텔은 이들 하드웨어를 지원할 소프트웨어가 필요한 상황이다. 클라우데라에의 투자를 이러한 필요성을 충족시켜줄 수 있다. 특정 용도의 애플리케이션에 최적화된 통합형 시스템에 대한 수요가 증가하고 있는 가운데, 인텔은 지난 수 년간 소프트웨어 부문에의 투자를 늘려왔다. 또 페이스북과 같은 대형 고객사를 대상으로 회사의 하드웨어를 특정 애플리케이션에 최적화하는 작업도 진행해왔다. 인텔 CEO 브라이언 크르자니크는 지난 달 레딧(Reddit)에서 진행된 사용자와의 대화에서 소프트웨어 부문에 집중하는 전략이 필요하다면서, 이는 어떤 칩이 향후 활용될지를 이해해야 하기 때문이라고 전했다. 크르자니크는 "트랜지스터를 칩에 삽입하기 전에 사용자 경험에 대해 오랜 기간 숙고하고 있다"라고 말했다. 한편 클라우데라에 대규모 투자를 단행한 기업은 최근에도 있었다. 클라우데라는 지난 주 T. 로우 프라이스, 구글 벤처스, MSD 캐피탈 등으로 구성된 투자자 그룹으로부터 1억 6,000만 달러의 투자금을 확보했다. 인텔은 클라우데라와 마찬가지로 애널리틱스용 아파티 하둡 배포판을 보유하고 있다. 인텔은 그러나 클라우데라가 인텔 아키텍처용, 즉 x86용 하둡을 개발할 것이라고 밝히며, 제품 로드맵이 궁국적으로 통합될 것이라고 전했다. ...

인텔 투자 하둡 x86 클라우데라

2014.03.28

인텔이 분산형 컴퓨팅 소프트웨어 기업 클라우데라에 투자한다. 회사의 x86 프로세서에 맞춰 하둡 소프트웨어를 튜닝하기 위한 목적이다. 회사는 클라우데라에의 투자금 규모에 대해서는 언급하지 않으면서도 '상당한' 규모라고 표현했다. 클라우데라는 대규모 데이터가 여러 컴퓨팅 리소스를 가로질러 처리할 수 있도록 하는 소프트웨어 도구를 개발하고 있다. 회사의 제품군은 오픈소스 소프트웨어 하둡에 기반하고 있다. 인텔은 성명서를 통해 "회사 역사상 데이터센터 기술 투자 중 최대 규모"라고 밝혔다. 프로세서, 마더보드, 네트워킹 스위치 등의 데이터센터용 하드웨어를 만들고 있는 인텔은 이들 하드웨어를 지원할 소프트웨어가 필요한 상황이다. 클라우데라에의 투자를 이러한 필요성을 충족시켜줄 수 있다. 특정 용도의 애플리케이션에 최적화된 통합형 시스템에 대한 수요가 증가하고 있는 가운데, 인텔은 지난 수 년간 소프트웨어 부문에의 투자를 늘려왔다. 또 페이스북과 같은 대형 고객사를 대상으로 회사의 하드웨어를 특정 애플리케이션에 최적화하는 작업도 진행해왔다. 인텔 CEO 브라이언 크르자니크는 지난 달 레딧(Reddit)에서 진행된 사용자와의 대화에서 소프트웨어 부문에 집중하는 전략이 필요하다면서, 이는 어떤 칩이 향후 활용될지를 이해해야 하기 때문이라고 전했다. 크르자니크는 "트랜지스터를 칩에 삽입하기 전에 사용자 경험에 대해 오랜 기간 숙고하고 있다"라고 말했다. 한편 클라우데라에 대규모 투자를 단행한 기업은 최근에도 있었다. 클라우데라는 지난 주 T. 로우 프라이스, 구글 벤처스, MSD 캐피탈 등으로 구성된 투자자 그룹으로부터 1억 6,000만 달러의 투자금을 확보했다. 인텔은 클라우데라와 마찬가지로 애널리틱스용 아파티 하둡 배포판을 보유하고 있다. 인텔은 그러나 클라우데라가 인텔 아키텍처용, 즉 x86용 하둡을 개발할 것이라고 밝히며, 제품 로드맵이 궁국적으로 통합될 것이라고 전했다. ...

2014.03.28

빅 데이터 업체로 쏠리는 '큰 돈'··· VC에 꾸준한 '인기'

벤처캐피탈(VC) 기업들이 빅 데이터 신생 벤처에 계속해서 큰 돈을 투자하는 것으로 나타났다. 최근 클라우데라는 T.로우프라이스(T. Rowe Price)와 구글 벤처스 등 투자자들에게 새로운 자금 160만 달러를 더 받았다. 자사의 하둡 분산 툴에 통합 툴을 더한 신 제품을 내놓은 클라우데라는 과거에도 약 3억 달러의 투자를 받은 적 있다. 클라우데라가 벤처캐피탈로부터 큰 투자를 받는다고 발표한 날 또다른 빅 데이터 분석 신생업체인 플랫포라(Platfora)도 투자 유치 사실을 밝혔다. 미국 산 마테오에 있는 플랫포라는 테나야 캐피탈(Tenaya Capital), 씨티벤처스, 시스코, 알레지스캐피탈(Allegis Capital)등의 투자자에게 약 3,800만 달러를 받았다. 최근 투자까지 합쳐 플랫포라가 받은 전체 투자자금은 6,500만 달러로 집계됐다. 플랫포라의 분석 및 시각화 소프트웨어는 하둡의 상단에서 구동하도록 설계됐으며 이 회사의 고객사로는 디렉TV, 디즈니, 워싱턴 포스트 등이 있다. 시스코에서 기업 비즈니스 개발 담당 힐튼 로만스키 수석 부사장은 "플랫포라의 분석 솔루션은 기존 인프라와 하둡 인프라를 즉각적으로 더 가치 있게 만들 뿐 아니라 비IT 비즈니스 전문가도 혁신에 필요한 데이터에 접근하도록 도와준다”고 성명서에서 밝혔다. 큰 그림으로 볼 때 빅 데이터 투자는 꾸준히 늘어나고 있다. CB인사이트(CB Insights)에 따르면, 2008년부터 2012년까지 빅 데이터 기업에 투자된 금액은 대략 49억 달러에 달했다. 2013년 상반기는 이러한 투자가 빠르게 진행됐다. 이 기간에만 빅 데이터 개인기업에 127건의 투자가 있었고 이 금액은 약 13억 달러였다고 CB인사이트는 전했다. 네덜란드에 있는 빅 데이터 자원 단체인 빅 데이터 스타트업(Big Data Startups)은 2013년 한 해 동안 투자자들이 빅 데이터 회사에 36억 달러를 쏟아부었다고 추정했다. 이밖에 최근에 투자받은 빅...

구글 빅데이터 IPO 투자 클라우데라 신생벤처 벤처캐피탈 VC

2014.03.21

벤처캐피탈(VC) 기업들이 빅 데이터 신생 벤처에 계속해서 큰 돈을 투자하는 것으로 나타났다. 최근 클라우데라는 T.로우프라이스(T. Rowe Price)와 구글 벤처스 등 투자자들에게 새로운 자금 160만 달러를 더 받았다. 자사의 하둡 분산 툴에 통합 툴을 더한 신 제품을 내놓은 클라우데라는 과거에도 약 3억 달러의 투자를 받은 적 있다. 클라우데라가 벤처캐피탈로부터 큰 투자를 받는다고 발표한 날 또다른 빅 데이터 분석 신생업체인 플랫포라(Platfora)도 투자 유치 사실을 밝혔다. 미국 산 마테오에 있는 플랫포라는 테나야 캐피탈(Tenaya Capital), 씨티벤처스, 시스코, 알레지스캐피탈(Allegis Capital)등의 투자자에게 약 3,800만 달러를 받았다. 최근 투자까지 합쳐 플랫포라가 받은 전체 투자자금은 6,500만 달러로 집계됐다. 플랫포라의 분석 및 시각화 소프트웨어는 하둡의 상단에서 구동하도록 설계됐으며 이 회사의 고객사로는 디렉TV, 디즈니, 워싱턴 포스트 등이 있다. 시스코에서 기업 비즈니스 개발 담당 힐튼 로만스키 수석 부사장은 "플랫포라의 분석 솔루션은 기존 인프라와 하둡 인프라를 즉각적으로 더 가치 있게 만들 뿐 아니라 비IT 비즈니스 전문가도 혁신에 필요한 데이터에 접근하도록 도와준다”고 성명서에서 밝혔다. 큰 그림으로 볼 때 빅 데이터 투자는 꾸준히 늘어나고 있다. CB인사이트(CB Insights)에 따르면, 2008년부터 2012년까지 빅 데이터 기업에 투자된 금액은 대략 49억 달러에 달했다. 2013년 상반기는 이러한 투자가 빠르게 진행됐다. 이 기간에만 빅 데이터 개인기업에 127건의 투자가 있었고 이 금액은 약 13억 달러였다고 CB인사이트는 전했다. 네덜란드에 있는 빅 데이터 자원 단체인 빅 데이터 스타트업(Big Data Startups)은 2013년 한 해 동안 투자자들이 빅 데이터 회사에 36억 달러를 쏟아부었다고 추정했다. 이밖에 최근에 투자받은 빅...

2014.03.21

'아직은 막상막하' 하둡 서비스 업체 9곳 장단점 정리

당신의 회사가 막대한 데이터를 다루고 있다면 하둡을 반드시 고려해봐야 한다. 한때 구글과 야후와 같은 글로벌 인터넷 기업의 전유물이던 가장 인기있고 잘 알려진 빅데이터 관리 시스템이 이제 다른 기업에까지 확산되고 있다. 거기에는 두 가지 이유가 있다. 첫째, 기업이 관리해야 될 데이터가 훨씬 많아졌고, 하둡은 기존의 정형 데이터와 새로운 비정형 데이터를 혼합하는데 탁월한 플랫폼이라는 점이다. 둘째, 수많은 개발업체가 하둡 지원과 서비스를 제공하는데 뛰어들어 기업 입장에서 선택의 폭이 늘어났다는 것이다. 포레스터 2013년 4분기 소프트웨어 조사 보고서에 따르면, 대부분의 기업들은 이미 보유한 데이터 가운데 단 12%만을 분석하고 있으며, 나머지 88%는 그냥 방치해두고 있다. 포레스터 애널리스트 마이크 갈티에리와 노엘 유하나는 "하둡은 자체 오픈소스 기반이 기업 데이터 관리 아키텍처로 넓고 깊게 성장함에 따라 더 이상 멈출 수 없는 흐름이 됐다"며, 최근 포레스터 웨이브 리포트(Wave Report)에서 하둡 시장에 대해 평가했다. 이 보고서는 "포레스터는 하둡이 대기업에게는 갖춰야 할(Must-have) 데이터 플랫폼이며, 모든 유연한 미래 데이터 관리 플랫폼의 초석을 형성하고 있다고 파악했다. 만약 자신의 조직에 정형, 비정형 혹은 바이너리 데이터가 많다면 하둡이 제 역할을 제대로 해낼 수 있다"고 설명했다. 그러면 어디서부터 시작할까? 포레스터는 다양한 분야 가운데 아홉 곳의 하둡 서비스 개발업체를 평가해 각각의 장단점을 밝혔다. 포레스터는 현 시점에서 빅데이터 벤처 업체들이 상당한 서비스 제공을 무기로 IT 업계를 대표하는 거대기업들과 우열을 가리기 힘든 경쟁을 하고있다고 결론내렸다. 우선 배경부터 정리해보자. 하둡은 오픈소스 아파치(Apache) 프로젝트로 누구든 무료로 하둡 커먼(Hadoop Common), HDFS(Hadoop Distributed File System), 하둡 ...

인텔 피보탈 호튼웍스 클라우데라 하둡 테라데이타 포레스터 AWS 마이크로소프트 IBM 맵R

2014.03.20

당신의 회사가 막대한 데이터를 다루고 있다면 하둡을 반드시 고려해봐야 한다. 한때 구글과 야후와 같은 글로벌 인터넷 기업의 전유물이던 가장 인기있고 잘 알려진 빅데이터 관리 시스템이 이제 다른 기업에까지 확산되고 있다. 거기에는 두 가지 이유가 있다. 첫째, 기업이 관리해야 될 데이터가 훨씬 많아졌고, 하둡은 기존의 정형 데이터와 새로운 비정형 데이터를 혼합하는데 탁월한 플랫폼이라는 점이다. 둘째, 수많은 개발업체가 하둡 지원과 서비스를 제공하는데 뛰어들어 기업 입장에서 선택의 폭이 늘어났다는 것이다. 포레스터 2013년 4분기 소프트웨어 조사 보고서에 따르면, 대부분의 기업들은 이미 보유한 데이터 가운데 단 12%만을 분석하고 있으며, 나머지 88%는 그냥 방치해두고 있다. 포레스터 애널리스트 마이크 갈티에리와 노엘 유하나는 "하둡은 자체 오픈소스 기반이 기업 데이터 관리 아키텍처로 넓고 깊게 성장함에 따라 더 이상 멈출 수 없는 흐름이 됐다"며, 최근 포레스터 웨이브 리포트(Wave Report)에서 하둡 시장에 대해 평가했다. 이 보고서는 "포레스터는 하둡이 대기업에게는 갖춰야 할(Must-have) 데이터 플랫폼이며, 모든 유연한 미래 데이터 관리 플랫폼의 초석을 형성하고 있다고 파악했다. 만약 자신의 조직에 정형, 비정형 혹은 바이너리 데이터가 많다면 하둡이 제 역할을 제대로 해낼 수 있다"고 설명했다. 그러면 어디서부터 시작할까? 포레스터는 다양한 분야 가운데 아홉 곳의 하둡 서비스 개발업체를 평가해 각각의 장단점을 밝혔다. 포레스터는 현 시점에서 빅데이터 벤처 업체들이 상당한 서비스 제공을 무기로 IT 업계를 대표하는 거대기업들과 우열을 가리기 힘든 경쟁을 하고있다고 결론내렸다. 우선 배경부터 정리해보자. 하둡은 오픈소스 아파치(Apache) 프로젝트로 누구든 무료로 하둡 커먼(Hadoop Common), HDFS(Hadoop Distributed File System), 하둡 ...

2014.03.20

클라우데라, 하둡용 인메모리 분석 툴 개발

하둡 업체인 클라우데라가 클레우데라의 하둡 환경에서 실시간으로 데이터를 분석하는 아파치 스파크(Apacahe Spark) 프로그램의 상용 버전을 개발했다. 이 상용 버전은 스트림 처리와 빠른 기계 학습을 위한 하둡 사용을 확대할 수 있다. 클라우데라의 제품 마케팅 담당 이사 매트 브랜드웨인은 "데이터 과학자들이 스파크를 좋아한다"라고 밝혔다. 브랜드웨인은 "지금까지 보면, 하둡을 사용한다고 하면, 대게 맵리듀스를 쓴다고 할 수 있다. 그러나 맵리듀스는 정말 느리다"라며 “맵리듀스 프레임워크는 여러 읽기 및 기계 학습 임무를 수행하기 위해 디스크에 많이 기록해야 한다”고 지적했다. 데이터가 메모리 작업에 머물러 있는 동안 스파크는 이 작업을 수행할 수 있다. 소프트웨어 유지보수 업체들은 스파크가 인메모리 설계 모델 덕분에 하둡보다 100배 빠르게 프로그램을 운영할 수 있다고 주장했다. 스파크는 일정한 데이터 흐름을 모니터링하고 일정한 조건이 충족될 경우. 특정 기능을 수행할 수 있는 스트림를 잘 처리한다. 가령 스트림 처리는 사기 관리와 보안 사과 관리에 적용할 수 있다. "이 경우 어떤 이상을 감지하고 조치를 취하기 위해 오프라인 상태에서도 실시간 데이터를 분석하고 있다"고 브랜드웨인은 말했다. 데이터를 좀더 상호작용하며 심도 깊은 배치 프로세싱 분석을 위한 하둡파일시스템으로 내릴 수도 있다. 처음 버클리대학에서 개발된 아파치 스파크는 실시간으로 조회 할 수 있는 서버 클러스터의 작업 메모리에 스트리밍 데이터를 로드할 수 있는 방법을 제공하고 있다. 아파치 스파크가 사용할 수 있는 서버 대수나 메모리 양에는 제한이 없다. 그것은 YaRN(Yet another Research Negotiator)을 사용하는 하둡 데이터 처리 네트워크의 최신 버전을 사용한다. 하지만 스파크는 배치 모드에서 작동하는 맵리듀스 프레임워크를 필요로 하지 않는다. 스파크는 자...

인메모리 하둡 인메모리 컴퓨팅 클라우데라 분석툴

2014.02.05

하둡 업체인 클라우데라가 클레우데라의 하둡 환경에서 실시간으로 데이터를 분석하는 아파치 스파크(Apacahe Spark) 프로그램의 상용 버전을 개발했다. 이 상용 버전은 스트림 처리와 빠른 기계 학습을 위한 하둡 사용을 확대할 수 있다. 클라우데라의 제품 마케팅 담당 이사 매트 브랜드웨인은 "데이터 과학자들이 스파크를 좋아한다"라고 밝혔다. 브랜드웨인은 "지금까지 보면, 하둡을 사용한다고 하면, 대게 맵리듀스를 쓴다고 할 수 있다. 그러나 맵리듀스는 정말 느리다"라며 “맵리듀스 프레임워크는 여러 읽기 및 기계 학습 임무를 수행하기 위해 디스크에 많이 기록해야 한다”고 지적했다. 데이터가 메모리 작업에 머물러 있는 동안 스파크는 이 작업을 수행할 수 있다. 소프트웨어 유지보수 업체들은 스파크가 인메모리 설계 모델 덕분에 하둡보다 100배 빠르게 프로그램을 운영할 수 있다고 주장했다. 스파크는 일정한 데이터 흐름을 모니터링하고 일정한 조건이 충족될 경우. 특정 기능을 수행할 수 있는 스트림를 잘 처리한다. 가령 스트림 처리는 사기 관리와 보안 사과 관리에 적용할 수 있다. "이 경우 어떤 이상을 감지하고 조치를 취하기 위해 오프라인 상태에서도 실시간 데이터를 분석하고 있다"고 브랜드웨인은 말했다. 데이터를 좀더 상호작용하며 심도 깊은 배치 프로세싱 분석을 위한 하둡파일시스템으로 내릴 수도 있다. 처음 버클리대학에서 개발된 아파치 스파크는 실시간으로 조회 할 수 있는 서버 클러스터의 작업 메모리에 스트리밍 데이터를 로드할 수 있는 방법을 제공하고 있다. 아파치 스파크가 사용할 수 있는 서버 대수나 메모리 양에는 제한이 없다. 그것은 YaRN(Yet another Research Negotiator)을 사용하는 하둡 데이터 처리 네트워크의 최신 버전을 사용한다. 하지만 스파크는 배치 모드에서 작동하는 맵리듀스 프레임워크를 필요로 하지 않는다. 스파크는 자...

2014.02.05

내부 훈련으로 빅 데이터 스킬 갭 극복 '페르사도의 사례'

최근 컴티아(CompTIA)가 미국의 비즈니스, IT 임원 500 명을 대상으로 진행한 서베이에 따르면, ‘직원들의 데이터 관리 및 분석 역량에 어느 정도, 혹은 상당한 부족함이 있다'고 생각하는 기업이 절반 이상이었다. 데이터 활용에 있어 선도적 위치에 서 있는 기업의 50%가, 그리고 평균적 혹은 후발 주자로서 데이터 활용 활동을 진행하고 있는 기업 가운데는 71%가 이와 같이 응답했다. 특히 데이터 포착 실패로 인해 시간이 낭비되고 우선순위 설정에 혼란이 오는, 그리고 판매량이 감소하고 신속성이 상실되는 등의 여러 문제가 이들 기업들이 고민하는 바였다. 더욱이 업계 전문가들은 스킬 부족 현상이 앞으로 더욱 심각해질 것이라는 전망을 내놓고 있는 상황이다. 맥킨지 글로벌 인스티튜트(McKinsey Global Institute)는 2018년에는 빅 데이터 관련 전문가 수요-공급의 격차가 미국 내에서만 170만에 이를 것이라 전망하기도 했다(고급 기술 및 분석 전문가 14~19만 명, 빅 데이터 결과물 작업 역량을 갖춘 매니저 및 애널리스트 150만 명). 그러나 컴티아의 리서치 및 마켓 인텔리전스 사업부 부사장이자 이번 2차 연례 빅 데이터 인사이트 앤 오퍼튜니티(Big Data Insights and Opportunities) 연구의 저자인 팀 허버트는 상황이 생각만큼 심각하지는 않다고 진단했다. “최고급 수준의 빅 데이터 역량을 필요로 하는, 예를 들자면 포천 100 그룹에 속할 정도의 기업들에겐 전문가 부족이 있을 것이다. 반면 중소 업체들의 경우에는 약간의 인력 충원에 더해 기존 직원들을 재교육하는 방식으로 자신들이 필요로 하는 빅 데이터 역량을 충당할 수 있을 것이다." "빅 데이터 관련 툴은 지속적으로 성숙해나갈 것이며, 이러한 툴의 기능 및 사용 편의 향상은 다른 영역의 전문가들이 빅 데이터를 이해하는데 많은 도움을 줄 것이다. 다른 여타 테크놀로지들과 마찬...

하둡 빅 데이터 클라우데라 스킬 갭 페르사도

2013.10.07

최근 컴티아(CompTIA)가 미국의 비즈니스, IT 임원 500 명을 대상으로 진행한 서베이에 따르면, ‘직원들의 데이터 관리 및 분석 역량에 어느 정도, 혹은 상당한 부족함이 있다'고 생각하는 기업이 절반 이상이었다. 데이터 활용에 있어 선도적 위치에 서 있는 기업의 50%가, 그리고 평균적 혹은 후발 주자로서 데이터 활용 활동을 진행하고 있는 기업 가운데는 71%가 이와 같이 응답했다. 특히 데이터 포착 실패로 인해 시간이 낭비되고 우선순위 설정에 혼란이 오는, 그리고 판매량이 감소하고 신속성이 상실되는 등의 여러 문제가 이들 기업들이 고민하는 바였다. 더욱이 업계 전문가들은 스킬 부족 현상이 앞으로 더욱 심각해질 것이라는 전망을 내놓고 있는 상황이다. 맥킨지 글로벌 인스티튜트(McKinsey Global Institute)는 2018년에는 빅 데이터 관련 전문가 수요-공급의 격차가 미국 내에서만 170만에 이를 것이라 전망하기도 했다(고급 기술 및 분석 전문가 14~19만 명, 빅 데이터 결과물 작업 역량을 갖춘 매니저 및 애널리스트 150만 명). 그러나 컴티아의 리서치 및 마켓 인텔리전스 사업부 부사장이자 이번 2차 연례 빅 데이터 인사이트 앤 오퍼튜니티(Big Data Insights and Opportunities) 연구의 저자인 팀 허버트는 상황이 생각만큼 심각하지는 않다고 진단했다. “최고급 수준의 빅 데이터 역량을 필요로 하는, 예를 들자면 포천 100 그룹에 속할 정도의 기업들에겐 전문가 부족이 있을 것이다. 반면 중소 업체들의 경우에는 약간의 인력 충원에 더해 기존 직원들을 재교육하는 방식으로 자신들이 필요로 하는 빅 데이터 역량을 충당할 수 있을 것이다." "빅 데이터 관련 툴은 지속적으로 성숙해나갈 것이며, 이러한 툴의 기능 및 사용 편의 향상은 다른 영역의 전문가들이 빅 데이터를 이해하는데 많은 도움을 줄 것이다. 다른 여타 테크놀로지들과 마찬...

2013.10.07

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.9