Offcanvas

CIO / 비즈니스|경제 / 빅 데이터 / 소프트스킬 / 인문학|교양

최형광 칼럼 | 데이터 비긴즈

2022.02.21 최형광  |  CIO KR
요한복음 1절은 이렇게 시작한다. “태초에 말씀(Word)이 있었다. 말씀은 하나님과 함께 있었고 말씀이 하나님이었다.” 말씀은 정보일까 데이터일까? 페이스북의 사진이나 동영상을 공유하며 좋아요를 누른다. 사진은 정보일까 데이터일까? 유튜브 동영상을 시청하니 데이터 소모량이 늘어나게 되었다면 이는 정보인가? 데이터인가?

데이터와 정보와 지식
맥도너(A.M.McDonough)는 정보경제학에서 '정보란 사실 내지 자료에 지적인 처리를 가하여 얻어진 지식’이라고 말한다. 데이터가 쌓인다고 정보가 쌓이지 않고 정보가 많다고 지식이 쌓이지 않는다. 데이터는 가치평가를 하지 않은 자료다. 특정 상황에 사용할 수 있게 정리된 내용을 정보라 한다. 그림은 앨런 켄트로(Allen kentro)의 '지식삼각형'(knowledge triangle)을 보여주고 있다. 


[그림 1] 지식삼각형'(knowledge triangle, Allen kentro) 

자료가 가치평가를 거치면 정보가 되고, 시간과 내용을 포괄하여 체계화되면 지식이 된다고 본다. 리차드 맥더멋(Richard Mcdermott)은 지식을 6가지 특성으로 나눈다. 첫째 아는 것은 인간이 가진 행위다. 둘째 지식은 생각에서 나온다. 셋째 지식은 현재 상황에서 나온다. 넷째 지식은 커뮤니티의 자산이다. 다섯째 지식은 다양한 방식으로 커뮤니티를 통해 순환된다. 여섯째 새로운 지식은 기존의 경계에서 생성된다. 6가지의 지식 특성을 정리하면 다음과 같다.

① 정보는 객체인 반면, 지식은 인간의 행위를 포함 
② 정보는 이미 완성되어 보관되어 있는데 반해, 지식은 현재시점에서 창출 
③ 정보의 이동은 저장소의 이동이며 지식은 현재시점을 고려하여 공유 
(Richard Mcdermott, 1999, KISDI 김희연).

데이터가 분석되면서 인간의 행위가 포함되어 정보와 지식으로 발전하게 되고 의사결정으로 이어진다. 

비대면과 비정형 데이터
정보경제학 측면의 데이터는 정형 데이터를 의미한다. 정형 데이터는 고도로 조직화된 테이블로 데이터베이스를 통해 추적 및 관리할 수 있으며 명확한 텍스트나 숫자로 표현된다. 많은 기업과 조직은 정제된 데이터를 분석하고 이를 기반으로 의사결정을 진행한다. 포레스터(J.W.Forrester)는 “경영은 정보를 행동으로 연결시키는 과정(Process)”이라고 표현한다.

모바일과 스마트폰, 비대면 시대의 진입으로 비정형 및 비정제된 데이터의 폭증을 맞고 있다. 비정제된 데이터의 폭증은 하드웨어 값의 하락에서 출발한다. 비정형 데이터는 원시적이며 목록화 되지 않은 방식이다. 사물인터넷에서 수집된 데이터, 소셜미디어 데이터, 센서 데이터 등 비대면 상황의 데이터 또한 폭증하고 있다.

메시지와 말씀(Speech), 동영상(YouTube) 등의 새로운 데이터는 기존의 데이터와 달리 구조화되지 않았으나 정보와 지식이 내포되어 있고, 트렌트 파악 및 잠재 가치 판단에 유용하지만 분석이 쉽지 않다.  사진과 동영상 짤은 데이터임과 동시에 정보이며 지식이다. 앞서 살펴본 바와 같이 상황에 맞게 정리된 사진과 동영상은 정보이며 생각의 행위를 거쳐 작성되었다면 지식이기 때문이다. 물론 사진과 동영상을 만드는 과정을 인간의 행위가 아닌 인공지능이나 자동화 프로세스로 구현하였다고 해도 마찬가지다.

데이터 비긴즈
인간은 새로운 비정형 데이터를 창출하는 주요 근원지 중 하나다. 비정형, 반정형 데이터가 전체 데이터의 90%를 상회하고 있다. IDC의 조사에 따르면 오는 2025년 한 해에 생성되는 세계 데이터 규모는 175ZB(제타바이트)로 전망된다. 2018년 세계 데이터 총량은 33ZB(Zatta Byte) 였다.

비정형 데이터의 가치 활용성은 이제 시작이다. 문제는 기존의 데이터 활용 방식으로 폭증하는 데이터를 효과적으로 처리할 수 없다 것이다. 새로운 데이터 활용에는 새로운 기술적 방법과 솔루션이 요구된다. 비구조적 비정형 데이터에는 NoSQL 등이 활용되고 있다.

데이터 활용과 분석에서 중요한 것은 어떤 목적을 가진 분석을 할 것인가? 이며 어떻게 데이터를 구축할 것인가이다. 이를 바탕으로 데이터를 활용한 비즈니스 개발과 의사결정을 만들 수 있다. 새로운 비즈니스 모델을 구축은 데이터의 분석 영역이 아니라 전략과 의사결정의 영역이며, 최근의 빅데이터는 인공지능을 활용하는 데이터 드리븐 비즈니스(Data Driven Business)로 발전하고 있다. 


[그림 2] 데이터 드리븐 비즈니스의 진화 (Data Driven Business Evolution, HK Choi). 데이터 기반 비즈니스는 전통적 정보처리에서 인공지능 활용으로 발전 중이며, 축적된 데이터 기반 정보(통찰력)로 의사결정(반응)하고 궁극적으로는 데이터(=정보)에서 반응(결정)하는 진화를 만들 수 있다고 보인다.

데이터 기반으로 결정(Data Driven)하는 것은 데이터의 취합과 분석 및 판단의 프로세스를 컴퓨터로 진행하는 방식이다. 이를 위해 첫째는 비즈니스를 이해하고 어떤 데이터가 중요한지 우선순위를 파악해야 하며 그 다음으로 기술적 인프라 활용과 연계가 이어져야 한다. 여기에는 기존의 데이터 분석 부서와 새로운 데이터 분석 부서의 융합과 시너지 환경이 중요해진다. 셋째는 시스템과 문화의 재구성이다. 기존의 데이터는 사람 중심으로 관리되고 평가되며 프로세싱 되었다. 그러나 데이터 드리븐 방식에서는 사람이 중심이 아니라 컴퓨터 중심으로 바꾸어야 한다. 그 동안의 당연한 방식을 바꾸어 데이터 중심의 프로세스와 조직과 문화로 구성해야 한다.

비대면 사회의 일상은 빠르게 재편되고 있다. 파괴적이고 혁신적인 상황의 비지니스도 시행착오를 통해 학습되고 성장한다. 모든 출발은 데이터 분석과 판단이며 이를 통한 결정에는 합리적 이성이 함께해야 한다. 빅데이터나 비정형 데이터 솔루션을 사용한다고 데이터 활용기업이 될 수 없다. 실패하고 빨리 학습하고 회복하는 과정에서 프로세스가 정립되고 도약하게 된다. 데이터 드리븐 비지니스도 혁신의 실패와 학습 과정을 거치게 된다. 데이터 비긴즈. 

* 최형광 교수(hk.choi@ssu.ac.kr)는 숭실대학교 일반대학원 AI·SW융합학과에서 학생들을 지도하고 있다. ciokr@idg.co.kr
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.