2012.08.23

빅 데이터를 결정하기 전에 필요한 질문 4가지

Reda Chouffani | CIO
빅 데이터는 비즈니스 프로세스를 개선하는 방법을 찾고 있는 기업들에게 많은 가능성을 제시해줄 것이다. 그 점에 이르기 전에, 당신은 어떤 데이터를 필요로 하고, 어떻게 그 데이터를 확보하며 그것을 어떻게 사용하고 거기서 어떤 시사점을 찾을 지를 알아야 한다. 이러한 고민들을 어떻게 풀어야 할 지 알아보자.

여러 조사에서 경영진들이 2012년과 2013년의 중요 프로젝트로 빅 데이터 도입을 지목한 것으로 나타났다. 빅 데이터가 프레젠테이션 능률을 올리고, 간소화시키며, 소비자 구매 성향에 대한 통찰력을 주는데다, 심지어 의료산업에서는 생명을 구하는 데 도움을 줄 수 있다는 점을 고려해보면, 이러한 경영진들의 생각이 그다지 놀라운 것은 아니다.

그러나, 빅 데이터에 대해 몇 가지 짚고 넘어가야 할 것들이 있다.

•어떤 데이터를 고려해야하나?
•데이터를 어떻게 수집하나?
•빅 데이터 도입이 회사에 어떤 실질적 혜택을 주나?
•빅 데이터의 투자 대비 성과는 어떻게 측정하나?

IT 경영진들 머리 속에는 이외에도 수많은 질문들이 떠오르겠지만, 위 4가지 질문이 가장 빈번히 거론되고 있기에, 이 4가지에 내해서만 해답을 소개하고자 한다.

어떤 데이터를 고려해야 하나?
데이터에는 정형, 반정형, 비정형, 이 3가지 형태가 있다. 정형 데이터는 컴퓨터와 인간 모두 읽을 수 있는 데이터다. 가장 대표적인 예로 관계형 데이터베이스(relational database)가 있다. 반정형 데이터에는 XML, 이메일, EDI 등이 포함되는데, 정형화 돼 있지 않지마 시맨틱 요소들을 분리하는 태그들을 가지고 있다. 마지막으로 비정형 데이터는 이미지, 오디오, 비디오 등의 데이터베이스에 들어가지 않는 데이터다.

데이터의 접근 제한을 풀고 접속 권한을 제공해 데이터를 저장하고 사용할 수 있게 하는 것이 가장 중요한 관건이다. 그러면 정보를 미가공(raw) 형태로 남길 수 있게 되어, 분석 시스템으로 실시간 스트리밍되면서 분석하고 보고할 수 있다. 정형 데이터에서는 이 과정이 상당히 직관적으로 일어난다. 그와 반대로, 비정형 데이터는 고급 알고리즘과 강력한 엔진을 반드시 거친 후 들어오는 데이터만을 처리할 수 있다.

 

---------------------------------------------------------------

데이터를 어떻게 수집하나?
세상에는 셀 수 없이 많은 데이터 소스에서, 역시 셀 수 없이 많은 유형의 데이터를 제공한다. 궁극적으로는 데이터 조합을 수집해야 한다는 결론에 이르게 된다.

요즘 회사들이 고객들과 브랜드 선호에 대한 정보를 얻기 위해 사용하는 데이터 소스가 바로 소셜 미디어다. 페이스북, 트위터 등의 주요 소셜 미디어 사이트들은 모두 API를 통해 일종의 데이터 접속 기능을 제공한다.

그 다음으로 중요한 데이터 소스는 위치와 이동 패턴(movement patterns)에 존재한다. RFID, 적외선, 무선 기술 등이 점점 소형화하고 단가가 낮아지면서, 기업들의 적절한 사업 애플리케이션에 그들의 위치를 보고하는 자원, 직원, 고객들이 점점 증가할 것이다.

기업들이 이런 소스에서 수집한 데이터를 클라우드와 웹에 저장돼 있는 정형 및 비정형 데이터들과 결합시킬 수 있다. 이 때 기업들은 이 데이터들을 반드시 가치 있는 방식으로 쓰도록 유념해야 한다.




2012.08.23

빅 데이터를 결정하기 전에 필요한 질문 4가지

Reda Chouffani | CIO
빅 데이터는 비즈니스 프로세스를 개선하는 방법을 찾고 있는 기업들에게 많은 가능성을 제시해줄 것이다. 그 점에 이르기 전에, 당신은 어떤 데이터를 필요로 하고, 어떻게 그 데이터를 확보하며 그것을 어떻게 사용하고 거기서 어떤 시사점을 찾을 지를 알아야 한다. 이러한 고민들을 어떻게 풀어야 할 지 알아보자.

여러 조사에서 경영진들이 2012년과 2013년의 중요 프로젝트로 빅 데이터 도입을 지목한 것으로 나타났다. 빅 데이터가 프레젠테이션 능률을 올리고, 간소화시키며, 소비자 구매 성향에 대한 통찰력을 주는데다, 심지어 의료산업에서는 생명을 구하는 데 도움을 줄 수 있다는 점을 고려해보면, 이러한 경영진들의 생각이 그다지 놀라운 것은 아니다.

그러나, 빅 데이터에 대해 몇 가지 짚고 넘어가야 할 것들이 있다.

•어떤 데이터를 고려해야하나?
•데이터를 어떻게 수집하나?
•빅 데이터 도입이 회사에 어떤 실질적 혜택을 주나?
•빅 데이터의 투자 대비 성과는 어떻게 측정하나?

IT 경영진들 머리 속에는 이외에도 수많은 질문들이 떠오르겠지만, 위 4가지 질문이 가장 빈번히 거론되고 있기에, 이 4가지에 내해서만 해답을 소개하고자 한다.

어떤 데이터를 고려해야 하나?
데이터에는 정형, 반정형, 비정형, 이 3가지 형태가 있다. 정형 데이터는 컴퓨터와 인간 모두 읽을 수 있는 데이터다. 가장 대표적인 예로 관계형 데이터베이스(relational database)가 있다. 반정형 데이터에는 XML, 이메일, EDI 등이 포함되는데, 정형화 돼 있지 않지마 시맨틱 요소들을 분리하는 태그들을 가지고 있다. 마지막으로 비정형 데이터는 이미지, 오디오, 비디오 등의 데이터베이스에 들어가지 않는 데이터다.

데이터의 접근 제한을 풀고 접속 권한을 제공해 데이터를 저장하고 사용할 수 있게 하는 것이 가장 중요한 관건이다. 그러면 정보를 미가공(raw) 형태로 남길 수 있게 되어, 분석 시스템으로 실시간 스트리밍되면서 분석하고 보고할 수 있다. 정형 데이터에서는 이 과정이 상당히 직관적으로 일어난다. 그와 반대로, 비정형 데이터는 고급 알고리즘과 강력한 엔진을 반드시 거친 후 들어오는 데이터만을 처리할 수 있다.

 

---------------------------------------------------------------

데이터를 어떻게 수집하나?
세상에는 셀 수 없이 많은 데이터 소스에서, 역시 셀 수 없이 많은 유형의 데이터를 제공한다. 궁극적으로는 데이터 조합을 수집해야 한다는 결론에 이르게 된다.

요즘 회사들이 고객들과 브랜드 선호에 대한 정보를 얻기 위해 사용하는 데이터 소스가 바로 소셜 미디어다. 페이스북, 트위터 등의 주요 소셜 미디어 사이트들은 모두 API를 통해 일종의 데이터 접속 기능을 제공한다.

그 다음으로 중요한 데이터 소스는 위치와 이동 패턴(movement patterns)에 존재한다. RFID, 적외선, 무선 기술 등이 점점 소형화하고 단가가 낮아지면서, 기업들의 적절한 사업 애플리케이션에 그들의 위치를 보고하는 자원, 직원, 고객들이 점점 증가할 것이다.

기업들이 이런 소스에서 수집한 데이터를 클라우드와 웹에 저장돼 있는 정형 및 비정형 데이터들과 결합시킬 수 있다. 이 때 기업들은 이 데이터들을 반드시 가치 있는 방식으로 쓰도록 유념해야 한다.


X