2017.12.11

그래프 데이터베이스란 무엇인가? 어떻게 활용하나?

Scott Carey | Computerworld UK

그래프 데이터베이스란 무엇이고, 현재 관심을 기울여야 할까? 그래프 데이터베이스의 가능성은 오픈소스 공급업체가 실제 사례로 엔터프라이즈 지원을 시작하면서 주류로 필터링하기 시작했다. 그렇다면, 여기에 관심을 가져야 하는 이유는 무엇인가?



지난 4월 파나마 페이퍼(Panama Papers) 유출 사건 기사를 읽은 독자라면, 그래프 데이터베이스(Graph Database)에 대해 들어봤을 것이다. 그래프 데이터베이스 기술은 언론인이 수많은 데이터 세트를 조사하고, 신속하게 개인과 기관, 조세 피난처를 연결할 수 있도록 도와줬다.

다양한 산업의 대기업들이 그래프 데이터베이스를 사용하는 사례가 느는 추세다. 예를 들어, 세계적인 대형 금융기관 가운데 상당수는 복잡한 데이터의 연결, 상관관계와 패턴이 데이터만큼 중요하다는 점을 인식하기 시작했다. 그래프 데이터베이스는 이런 상관관계를 찾아 활용할 수 있는 방법을 제공한다.

시맨틱(semantic) 웹 회사인 온투텍스트(Ontotext)의 매니징 컨설턴트 자레드 맥기니스는 “그래프는 항상 이치에 맞았다. 더 나아가 이론적으로는 더 우수하다. 하지만 관계형 데이터베이스가 너무 우수해 항상 따라잡아야 하는 처지였다. 그러던 것이 ‘티핑포인트’에 도달했다. 이제 더 이상 난해하지 않다. 충분히 성숙해졌다. 기업 환경에서 효과가 있음을 보여주는 사례들이 많다”고 말했다.

그래프 데이터베이스란?
그래프 데이터베이스는 그래프 이론에 토대를 둔 일종의 NoSQL 데이터베이스다. 객체나 노드로 불리는 데이터 포인트를 플롯하고, 그래프에서 이들을 연결하는 컴퓨터 과학 학문의 방법론이다.

기존 관계형 데이터베이스는 데이터를 열과 행으로 저장하고, NoSQL 데이터베이스는 많은 비정형 데이터를 저장한다. 그런데 그래프 데이터베이스는 여기에서 한 걸음 더 나아간다. 데이터 포인트를 연결, 데이터 네트워크를 구축한다.

오픈소스 소프트웨어 업체인 데이터스택스(DataStax)의 빌리 보스워스(Billy Bosworth) CEO는 그래프 데이터베이스를 “데이터 세트를 쿼리하는 것을 넘어, 연결부(상관관계)와 패턴을 찾는 방법”이라고 정의한다.

또한 그래프 데이터베이스는 데이터의 아주 복잡한 관계를 더 쉽고 빠르게 파악할 수 있도록 도와준다고 덧붙였다.

그래프 데이터베이스 업체인 네오 테크놀로지스(Neo Technologies)를 공동 창업한 에밀 에프렘은 15년 전 기존 관계형 데이터베이스를 이용해 기업 고객용 콘텐츠 관리 시스템을 구현하다 어려움에 직면하면서 그래프 데이터베이스를 구축하기 시작했다.

그는 “우리가 다뤘던 정보가 맞지 않아 문제가 있었다. 아주 크고, 체계적이지 못하며, 서로 연결되어 있고, 계속 바뀌고 진화하는 정보였다. 사각형 구멍에 원통을 집어넣으려 시도한 것이나 다름없었다”고 설명했다. 그리고 이런 노력의 결과물인 Neo4j 그래프 데이터베이스였다.
 


그래프 데이터베이스의 역사
그래프 데이터베이스는 기업들이 도입하는 첨단 기술 상당수처럼 유수 기술 기업의 대규모 데이터센터 부문에서 처음으로 관심을 끌기 시작했다.

인터넷과 서로 연결된 데이터의 특징 때문에 페이스북과 구글 같은 회사들은 수십 년 동안 일종의 그래프 데이터베이스를 기반으로 사업을 해왔다.

마크 저커버그는 페이스북이 사용자의 ‘소셜 그래프(Social Graph)’라고 강조했다. 10년 전 오픈 그래프 프로토콜(Open Graph Protocol)을 토대로, 즉 수학 이론을 특정 컴퓨터 과학 애플리케이션으로 바꿔 소셜 네트워크를 구축했기 때문이다.

그렇다면 그래프 데이터베이스가 ‘일반적인 개념’이 되기 시작하는 이유는 무엇일까?

네오의 에프렘에 따르면, 그래프가 1970년대 등장한 객체 데이터베이스의 한계 가운데 일부를 극복해 준다는 점에 대한 인식이 높아지고 있기 때문이다.

에프렘은 “객체 데이터베이스는 대형 ‘실패작’ 가운데 하나다. 프로그래밍 패러다임을 가져와 데이터 모델로 바꾼 것이 가장 큰 문제 중 하나였다. 우리는 데이터의 수명이 소프트웨어 수명보다 훨씬 더 길다는 것을 배웠다. 따라서 이를 분리해야 한다. 소프트웨어를 옮겨야 데이터가 산다. 객체 모델의 중요한 문제점 중 하나고, 우리는 이런 이유로 객체 모델을 피했다”고 설명했다.

 




2017.12.11

그래프 데이터베이스란 무엇인가? 어떻게 활용하나?

Scott Carey | Computerworld UK

그래프 데이터베이스란 무엇이고, 현재 관심을 기울여야 할까? 그래프 데이터베이스의 가능성은 오픈소스 공급업체가 실제 사례로 엔터프라이즈 지원을 시작하면서 주류로 필터링하기 시작했다. 그렇다면, 여기에 관심을 가져야 하는 이유는 무엇인가?



지난 4월 파나마 페이퍼(Panama Papers) 유출 사건 기사를 읽은 독자라면, 그래프 데이터베이스(Graph Database)에 대해 들어봤을 것이다. 그래프 데이터베이스 기술은 언론인이 수많은 데이터 세트를 조사하고, 신속하게 개인과 기관, 조세 피난처를 연결할 수 있도록 도와줬다.

다양한 산업의 대기업들이 그래프 데이터베이스를 사용하는 사례가 느는 추세다. 예를 들어, 세계적인 대형 금융기관 가운데 상당수는 복잡한 데이터의 연결, 상관관계와 패턴이 데이터만큼 중요하다는 점을 인식하기 시작했다. 그래프 데이터베이스는 이런 상관관계를 찾아 활용할 수 있는 방법을 제공한다.

시맨틱(semantic) 웹 회사인 온투텍스트(Ontotext)의 매니징 컨설턴트 자레드 맥기니스는 “그래프는 항상 이치에 맞았다. 더 나아가 이론적으로는 더 우수하다. 하지만 관계형 데이터베이스가 너무 우수해 항상 따라잡아야 하는 처지였다. 그러던 것이 ‘티핑포인트’에 도달했다. 이제 더 이상 난해하지 않다. 충분히 성숙해졌다. 기업 환경에서 효과가 있음을 보여주는 사례들이 많다”고 말했다.

그래프 데이터베이스란?
그래프 데이터베이스는 그래프 이론에 토대를 둔 일종의 NoSQL 데이터베이스다. 객체나 노드로 불리는 데이터 포인트를 플롯하고, 그래프에서 이들을 연결하는 컴퓨터 과학 학문의 방법론이다.

기존 관계형 데이터베이스는 데이터를 열과 행으로 저장하고, NoSQL 데이터베이스는 많은 비정형 데이터를 저장한다. 그런데 그래프 데이터베이스는 여기에서 한 걸음 더 나아간다. 데이터 포인트를 연결, 데이터 네트워크를 구축한다.

오픈소스 소프트웨어 업체인 데이터스택스(DataStax)의 빌리 보스워스(Billy Bosworth) CEO는 그래프 데이터베이스를 “데이터 세트를 쿼리하는 것을 넘어, 연결부(상관관계)와 패턴을 찾는 방법”이라고 정의한다.

또한 그래프 데이터베이스는 데이터의 아주 복잡한 관계를 더 쉽고 빠르게 파악할 수 있도록 도와준다고 덧붙였다.

그래프 데이터베이스 업체인 네오 테크놀로지스(Neo Technologies)를 공동 창업한 에밀 에프렘은 15년 전 기존 관계형 데이터베이스를 이용해 기업 고객용 콘텐츠 관리 시스템을 구현하다 어려움에 직면하면서 그래프 데이터베이스를 구축하기 시작했다.

그는 “우리가 다뤘던 정보가 맞지 않아 문제가 있었다. 아주 크고, 체계적이지 못하며, 서로 연결되어 있고, 계속 바뀌고 진화하는 정보였다. 사각형 구멍에 원통을 집어넣으려 시도한 것이나 다름없었다”고 설명했다. 그리고 이런 노력의 결과물인 Neo4j 그래프 데이터베이스였다.
 


그래프 데이터베이스의 역사
그래프 데이터베이스는 기업들이 도입하는 첨단 기술 상당수처럼 유수 기술 기업의 대규모 데이터센터 부문에서 처음으로 관심을 끌기 시작했다.

인터넷과 서로 연결된 데이터의 특징 때문에 페이스북과 구글 같은 회사들은 수십 년 동안 일종의 그래프 데이터베이스를 기반으로 사업을 해왔다.

마크 저커버그는 페이스북이 사용자의 ‘소셜 그래프(Social Graph)’라고 강조했다. 10년 전 오픈 그래프 프로토콜(Open Graph Protocol)을 토대로, 즉 수학 이론을 특정 컴퓨터 과학 애플리케이션으로 바꿔 소셜 네트워크를 구축했기 때문이다.

그렇다면 그래프 데이터베이스가 ‘일반적인 개념’이 되기 시작하는 이유는 무엇일까?

네오의 에프렘에 따르면, 그래프가 1970년대 등장한 객체 데이터베이스의 한계 가운데 일부를 극복해 준다는 점에 대한 인식이 높아지고 있기 때문이다.

에프렘은 “객체 데이터베이스는 대형 ‘실패작’ 가운데 하나다. 프로그래밍 패러다임을 가져와 데이터 모델로 바꾼 것이 가장 큰 문제 중 하나였다. 우리는 데이터의 수명이 소프트웨어 수명보다 훨씬 더 길다는 것을 배웠다. 따라서 이를 분리해야 한다. 소프트웨어를 옮겨야 데이터가 산다. 객체 모델의 중요한 문제점 중 하나고, 우리는 이런 이유로 객체 모델을 피했다”고 설명했다.

 


X