그래프 데이터베이스란 무엇이고, 현재 관심을 기울여야 할까? 그래프 데이터베이스의 가능성은 오픈소스 공급업체가 실제 사례로 엔터프라이즈 지원을 시작하면서 주류로 필터링하기 시작했다. 그렇다면, 여기에 관심을 가져야 하는 이유는 무엇인가?
지난 4월 파나마 페이퍼(Panama Papers) 유출 사건 기사를 읽은 독자라면, 그래프 데이터베이스(Graph Database)에 대해 들어봤을 것이다. 그래프 데이터베이스 기술은 언론인이 수많은 데이터 세트를 조사하고, 신속하게 개인과 기관, 조세 피난처를 연결할 수 있도록 도와줬다.
다양한 산업의 대기업들이 그래프 데이터베이스를 사용하는 사례가 느는 추세다. 예를 들어, 세계적인 대형 금융기관 가운데 상당수는 복잡한 데이터의 연결, 상관관계와 패턴이 데이터만큼 중요하다는 점을 인식하기 시작했다. 그래프 데이터베이스는 이런 상관관계를 찾아 활용할 수 있는 방법을 제공한다.
시맨틱(semantic) 웹 회사인 온투텍스트(Ontotext)의 매니징 컨설턴트 자레드 맥기니스는 “그래프는 항상 이치에 맞았다. 더 나아가 이론적으로는 더 우수하다. 하지만 관계형 데이터베이스가 너무 우수해 항상 따라잡아야 하는 처지였다. 그러던 것이 ‘티핑포인트’에 도달했다. 이제 더 이상 난해하지 않다. 충분히 성숙해졌다. 기업 환경에서 효과가 있음을 보여주는 사례들이 많다”고 말했다.
그래프 데이터베이스란?
그래프 데이터베이스는 그래프 이론에 토대를 둔 일종의 NoSQL 데이터베이스다. 객체나 노드로 불리는 데이터 포인트를 플롯하고, 그래프에서 이들을 연결하는 컴퓨터 과학 학문의 방법론이다.
기존 관계형 데이터베이스는 데이터를 열과 행으로 저장하고, NoSQL 데이터베이스는 많은 비정형 데이터를 저장한다. 그런데 그래프 데이터베이스는 여기에서 한 걸음 더 나아간다. 데이터 포인트를 연결, 데이터 네트워크를 구축한다.
오픈소스 소프트웨어 업체인 데이터스택스(DataStax)의 빌리 보스워스(Billy Bosworth) CEO는 그래프 데이터베이스를 “데이터 세트를 쿼리하는 것을 넘어, 연결부(상관관계)와 패턴을 찾는 방법”이라고 정의한다.
또한 그래프 데이터베이스는 데이터의 아주 복잡한 관계를 더 쉽고 빠르게 파악할 수 있도록 도와준다고 덧붙였다.
그래프 데이터베이스 업체인 네오 테크놀로지스(Neo Technologies)를 공동 창업한 에밀 에프렘은 15년 전 기존 관계형 데이터베이스를 이용해 기업 고객용 콘텐츠 관리 시스템을 구현하다 어려움에 직면하면서 그래프 데이터베이스를 구축하기 시작했다.
그는 “우리가 다뤘던 정보가 맞지 않아 문제가 있었다. 아주 크고, 체계적이지 못하며, 서로 연결되어 있고, 계속 바뀌고 진화하는 정보였다. 사각형 구멍에 원통을 집어넣으려 시도한 것이나 다름없었다”고 설명했다. 그리고 이런 노력의 결과물인 Neo4j 그래프 데이터베이스였다.