Offcanvas

AI / 디지털 트랜스포메이션 / 통신|네트워크

칼럼ㅣ정보에 맥락 부여… 지식 그래프가 인사이트 확보에 적합한 이유

2021.08.25 Szymon Klarman  |  IDG Connect
지식과 정보에 맥락이 부족해 AI의 인사이트를 활용하는 데 애를 먹는 기업들이 있다. 지식 그래프는 바로 이럴 때 유용하다. 

인공지능은 인간 지능에 비교되곤 한다. 하지만 일부 영역에서는 AI가 인간 지능에 필적하는 역량을 보이기도 한다. 예컨대, AI 제품들은 머신러닝을 통해 데이터를 범주화하고, 분류하며, 데이터 기반의 예측을 제공함으로써 성공적인 결과를 내곤 한다.

그러나 이러한 인사이트를 사용해 조직에 뚜렷한 변화를 가져오는 것이 쉽지만은 않다. 인간 지능의 기본 구성 요소인 맥락 정보가 부족한 탓이다. 이런 이유로 그래프 기술이 필요하다. 
 
ⓒGetty Images Bank

가트너 고객의 AI 관련 문의 중 무려 50%는 그래프 기술 활용 방법에 대한 것이다. 한편 가트너는 2023년까지 전 세계 조직의 30%가 의사결정 과정에서 그래프 기술을 통해 (정보를) 빠르게 맥락화할 수 있을 것이라 전망했다. 

지식 그래프는 기업들이 눈여겨보는 핵심 기술 중 하나다. 이 기술이 '기업의 위험'이나 '장비 수리' 등 특정 분야의 모든 개념들을 표현할 수 있어서다. 또한 이는 조직, 인력, 위치, 거래 등 이해 관계자 간 맺고 있는 관계 탐색을 지원할 수 있다.

조직은 대규모 데이터를 처리하는 데 애를 먹다보니, 부득이하게 모순적이고 중복되며 불완전한 정보에 입각해 결정을 내리기도 한다. 이때 지식 그래프를 기반으로 단일한 진실 공급원(SSOT)을 생성하면 대규모 데이터를 (사람과 유사한 방식으로) 맥락화할 수 있다. 

사람은 의식적이든 무의식적이든 세상에 대해 알거나 믿는 바에 따라 결정을 내린다. 가령, 어떤 구직자는 특정 회사의 판매 제품과 고객을 잘 알고 있다는 이유로 그 회사에 지원한다. 이러한 맥락을 통해 구직자는 자신이 채용될 가능성을 더욱 잘 가늠할 수 있다. 지식 그래프는 바로 이런 맥락을 모방한다. 이는 AI 기술을 이용해 인사이트를 추출하는 기반이 된다. 궁극적으로 기업은 이러한 인사이트를 사용해 의사결정을 내릴 수 있다. 

지식 그래프의 작동 방식
대부분의 사람은 자신도 모르게 지식 그래프를 사용한다. 예를 들어 구글 검색을 하거나 인기 있는 음식 배달 앱을 사용하는 경우다. 구글 검색창에 '알렉산더 플레밍(최초의 항생제(페니실린)를 발견한 것으로 잘 알려진 미생물학자)'을 입력하면 사용자는 이 검색어가 담긴 글의 링크뿐만 아니라 특정 개체에 관한 데이터가 담긴 정보 상자를 얻을 수 있다. 

이 정보 상자 안에는 '플레밍이 페니실린을 발견했음'과 같은 핵심 정보를 비롯해 그의 출생지, 생년월일 같은 내용이 들어 있다. 이런 데이터들은 표면적인 정보 아래에 위치한 지식 그래프의 작은 조각에 대응된다.

이 그래프의 노드는 실제 사물 또는 개념을 나타내며, (노드들을 잇는) 간선은 이들의 특성이나 관계를 표현한다. '날짜', '사람', '태어난', '발명', '물체' 같은 라벨은 전체 구조의 의미(의미론)를 명확하게 해주는 역할을 한다. 

구글의 지식 그래프는 인터넷상의 각기 다른 출처에서 발견된 이런 사실들을 하나의 개념 지도에 연결된 조각들로 간주한다. 이러한 방식으로 표현된 데이터 네트워크는 훨씬 직관적이다. 뿐만 아니라 주어진 도메인에 있는 각 주체 간의 관계를 명료하게 만들어준다. 이를 통해 사용자는 모든 정보를 맥락에 맞게 접근하고 이해할 수 있다.  

이를테면 '페니실린 발명가의 생년월일'을 검색할 경우 올바른 응답은 1881년 8월 6일이다. 이 응답은 지식 그래프의 두 노드를 가로지른 결과값이다. 이는 마치 페니실린 발명가의 생년월일에 대한 지식을 가진 사람이 올바른 응답이 무엇인지 탐색하는 방식과 같다.

즉, 명명된 객체에서 사람으로 연결돼 최종적으로 생년월일에 도달하는 방식인 셈이다. 지식 그래프의 주요 이점 중 하나는 데이터 연결을 비롯해 불명확하고 간접적인 관계를 명확하게 하는 데 있다. 타깃 엔터프라이즈 지식 그래프는 특정 도메인(가령, 사이버 보안 또는 위험 관리)에 대해 위와 같은 작업을 수행한다. 

기술적 관점에서 지식 그래프는 실시간 정보 자산에 해당한다. 이 그래프는 다양한 AI 기술을 기반으로 데이터를 철저하게 해석하고 광범위한 비즈니스 문제를 해결하는 데이터 관리 프로세스를 수반한다. 가트너는 이러한 다중 AI 기술 활용을 일컬어 '복합 AI'라고 부른다. 

지식 그래프는 검색어에 대응하는 응답과 관련한 모든 정보를 하나의 일관된 개념 지도에 표시할 수 있다. 덕분에 의사결정자는 전례 없는 세밀함, 깊이, 정밀성에 기반한 인사이트를 얻을 수 있다. 모든 데이터와 그 관계성에 대한 개요를 명확하게 보여주는 것은 안전, 실사 혹은 컴플라이언스와 관련한 비즈니스 의사 결정을 내리는 데 있어 특히 중요하다. 

기업의 지식 그래프 사용 방법
지식 그래프는 소비자용 애플리케이션에만 유용한 것이 아니다. 기업은 이 기술을 사용하여 제품, 서비스 및 클라이언트에 대한 데이터를 처리할 수 있다. 심지어 여러 데이터베이스, 스프레드시트, 문서에 데이터가 분산돼 있더라도 처리가 가능하다.

그래프 기술은 조직이 정형, 비정형, 내부 및 외부 데이터를 결합할 수 있도록 지원한다. 또 조건부 규칙과 머신러닝 추론을 통해 복잡한 로직을 구현하고, 지속적인 업데이트를 통해 변화하는 사용자 및 시장의 요구에 적응하는 데 도움을 줄 수 있다. 

지식 그래프 활용 사례 중 하나로는 특정 기업(잠재 고객 혹은 파트너)에 대한 연구 수행을 들 수 있다. 

일반적으로 애널리스트는 기업 리서치를 수행하기 위해 수십 개의 내부 데이터베이스, 지식 플랫폼, 문서 및 스프레드시트를 액세스하고 검토한다. 그리고 실제 분석을 시작하기에 앞서 해당 기업을 합리적이고 종합적으로 연구하기 위해 공공 API, 웹사이트 및 뉴스 원천 정보를 긁어와야 한다. 이 과정에서 많은 시간이 소요되고 오류가 발생한다. 확장성이 떨어질 수도 있다. 이로 인해 정보에 입각한 의사 결정을 내리는 비용이 크게 증가한다. 

반면에 단일한 진실 공급원이 지식 그래프 형태로 구성되면 ‘기업의 직간접적 자회사는 어디인가?’라는 질문에 쉽게 답할 수 있다. 고급 네트워크 분석을 통하면 ‘네트워크에서 가장 중요한 주주는 누구인가?’처럼 훨씬 복잡한 질문에도 답을 얻을 수 있다.

머신러닝 알고리즘은 지식 그래프를 기반으로 고급 분류 결과값이나 예측치를 생성할 수 있다. 동일한 정확성을 확보하려면 분류하려는 각 기업과 관련된 여러 공통된 특징을 수집해야 한다.

이렇게 구성된 지식 그래프는 어떤 대상이든 360도로 관찰할 수 있게 해주는 기반이 된다. 그래프의 구조와 각 개체 간의 연결은 인공 및 자율 에이전트를 통해 캡처되고 분석될 수 있다. 만약 자동화 워크플로우와 AI 기술을 결합해 처리와 평가를 할 경우 더욱 큰 유연성과 인사이트를 얻는 것은 물론, 컴퓨팅 파워와 스토리지 자원을 줄일 수 있다.

나아가 어쩌면 폭넓은 분야의 애플리케이션(가령, 부정 행위 및 돈세탁 방지용)에 맞춘 정교한 AI 시스템의 기반으로서 지식 그래프를 활용할 수도 있다. 

지식 그래프는 직접 사용하든 타사 시스템을 통해서 활용하든 기업의 핵심 자원으로 추가할 수 있는 중요한 기술이다. 다만 사내에서 지식 그래프를 구축하면 많은 자원이 소모될 수 있다. 따라서 기술을 폭넓게 활용하려면 화이트박스 AI를 필수적으로 설계하는 게 좋다.

아울러 지식 그래프를 통해 기업은 인간이 자체적으로 처리할 수 없는 대량의 데이터를 맥락별로 분류할 수 있다. 이 기술은 애널리스트로 하여금 추출된 지식을 효율적으로 분석하여 다른 AI 기술에 문맥과 깊이를 더하고 인간과 시스템을 연결하는 가교 역할을 할 수 있도록 지원한다.

* 기고자 지몬 클라만은 블랙스완 테크놀로지스(BlackSwan Technologies)의 지식 아키텍트다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.