2017.04.03

'바이템포럴' 데이터 관리가 필요한 이유

Matt Allen | Network World
* 본 기고문은 벤더가 작성한 것으로 네트워크월드 편집진의 수정을 거쳤다. 그러나 벤더의 시각이 일부 남아 있을 수 있다.

오늘날 데이터베이스는 주된 기록 시스템이며 기업은 이벤트가 발생할 때 정확한 청사진을 보존해야 한다. 그러나 안타깝게도 전통적인 데이터베이스는 일시적이며 다른 시점에서 기업에 대한 정확한 청사진을 제공할 수 없다.



그래서 특히 규제가 심한 업계에서 꼭 필요한 것이 바로 '바이템포럴(Bitemporal)' 데이터 지원이다. 두 개의 타임라인(Timeline)을 따라 실제 세계에서 사실이 발생한 시점('자신이 알던 것')과 시스템 시간 및 사실이 데이터베이스에 기록된 시간('자신이 알았던 시점') 등 유효한 두 시점에 대한 타임스탬프(Timestamp)를 적용해 데이터를 저장 및 질의할 수 있다.

오늘날 점차 많은 기업이 시간 기반의 통찰을 필요로 한다. 이는 이력 데이터를 처리하는 데도 효과적이어서 보안과 데이터 관리가 필요한 기업에도 도움이 된다. 기업은 바이템포럴 데이터베이스를 이용해 과거에 대한 완전하고 정확한 청사진을 유지해 누가 무엇을 알았고 언제 무엇을 했는지 정확히 파악할 수 있다.

바이템포럴 데이터베이스는 시스템과 유효 시간축 전반에 걸쳐 질의 처리가 가능하기 때문에 템포럴(Temporal) 데이터베이스보다 더 강력하다. 손쉽게 시간을 거슬러 올라가 데이터를 검색하고 시스템 전반에 걸쳐 이력 데이터를 관리하고 데이터 무결성을 확보하며 복잡한 바이템포럴 분석을 수행할 수 있다.

예를 들어, “8월 20일에 존 토마스가 살던 곳은?”이라는 질문에는 템포럴 데이터베이스도 답할 수 있다. 하지만 바이템포럴 데이터베이스는 “9월 1일 현재 우리가 알고 있는 8월 20일에 존 토마스가 살던 곳은?”이라는 질문에 답할 수 있다.

이처럼 바이템포럴은 유효한 시스템 시간축에 대한 요소 범위 인덱싱(Indexing)이 적용된 일련의 문서로써 관리되는 바이템포럴 문서를 활용한다. 문서는 보안 권한으로 제어하는 여러 개의 보안 컬렉션에 저장된다. 데이터베이스에 삽입된 초기의 문서를 보존하고 절대로 변경하지 않기 때문에 완전한 거버넌스(Governance) 및 불역성을 통해 정보의 출처를 추적할 수 있다.


바이템포럴 데이터베이스 기술 도입을 판단할 때 검토할 것은 다음과 같다.

- 사업에 대한 이력 데이터 손실을 감당할 수 있는가? 규제 비용이 크고 시간과 비용이 많이 소요되는 시대에 데이터베이스는 주요 기록 시스템이 돼야 한다. 안타깝게도 전통적인 데이터베이스는 과거의 이력을 온전히 보존하지 않으며 데이터를 잃을 수 밖에 없다. 금융 기업이 바이템포럴 기술을 활발하게 사용하는 이유도 이 때문이다. 예를 들어 바이템포럴은 대형 금융 기업이 데이터를 더 잘 관리해 새로운 규정과 감사에 대응하고 위험을 더 잘 관리하는 데 도움이 된다.

- 이력 데이터를 업데이트해야 하는 경우가 있는가? 이력 데이터 업데이트가 필요한 기업은 바이템포럴의 혜택을 누릴 수 있다. 예를 들어 금융 거래 기업에서 거래가 이루어진 후 수정이 가능하다. 이런 변화에 대한 시간 기준 기록이 없다면 미래의 거래 위치 분석에 문제가 생기고 기업은 규제 당국으로부터 높은 벌금을 부과 받을 수 있다. 유니템포럴 데이터베이스를 통한 업데이트는 이력 데이터를 덮어 쓰기 때문에 개인 거래자와 기업 전체에 엄청난 위험이 발생할 수 있다. 반면 바이템포럴 아키텍처는 거래 상대방 이름, 트랜잭션 ID, 가격 수정이 발생하는 때를 포함해 거래 검토의 라이프사이클 전체에 대한 정확한 청사진을 제공한다.

- 규제 당국에 이력 데이터를 제공해야 하는가? 우리는 규제가 강화될 뿐 완화될 조짐이 없는 시대를 살고 있다. 실제로 금융 서비스 부문은 2008년의 금융 위기 이후로 상당한 변화를 추구해야 했고 모든 산업의 기업이 이력 데이터를 처리해야 하는 상황이다. 바이템포럴을 통해 기업은 데이터의 변경사항을 포함해 이력 데이터를 보존할 수 있고 감사 및 기타 목적을 위해 필요할 때 정보를 손쉽게 수집 및 제시할 수 있다.

- 이벤트의 순서와 기록이 보안 및 정보뿐만 아니라 전반적인 전략에 중요한가? 많은 산업에서 바이템포럴 기술의 장점을 누릴 수 있다. 예를 들어, 의료 산업의 경우 환자의 이력에 대한 더 정확한 청사진을 제공해 질병과 선행 사건을 연결하는 데 도움이 된다.

마찬가지로 정부 정보와 사법 기관은 바이템포럴 지원을 통해 데이터베이스를 활용해 겉으로 보기에는 이질적인 데이터를 이해해 동기를 더 잘 파악하고 심지어 미래 상황도 예측할 수 있다. 기업은 이 데이터를 활용해 고객 패턴과 행동을 판단하고 더 전략적으로 신제품과 서비스를 개발할 수 있다.

- 이력 데이터 저장, 접근, 보안의 비용과 복잡성이 증가하고 있는가? 데이터 1기가바이트(Gigabyte)당 비용이 감소하고 있지만 오늘날의 기업은 너무 많은 이력 데이터를 처리하고 있어 저장에 더 큰 비용을 지출하고 있다. 기업은 일반적으로 데이터를 저장해 놓는 경향이 있지만 일부 경우는 규제 때문에라도 필요하다. 바이템포럴 데이터 관리는 이력 데이터를 위한 추가 데이터베이스를 구성할 필요가 없으므로 저장소를 관리하는 데 도움이 된다.

- 데이터베이스 개발자가 점차 이력 데이터 관리, 접근, 보안의 복잡성을 부담스러워하고 있는가? 개발자는 단지 이력 데이터에 손쉽게 접근할 수 있는 쿼리를 작성하기를 바란다. 바이템포럴을 이행하지 않고 중요한 이력 데이터 구성 요소를 추적하지 않는 경우 개발자는 데이터에 대한 구체적인 질문을 던질 수 없다. 또한 전통적인 데이터베이스에서는 다양한 타임라인과 버전을 관리하기가 꽤 복잡해 개발자에게 추가적인 부담을 주지만, 바이템포럴 디자인은 덜 복잡하기 때문에 데이터 접근을 간소화할 수 있다.

- 데이터 거버넌스에 대한 청사진 전체를 고려하고 있는가? 바이템포럴 데이터 관리는 데이터 거버넌스에서 중요하다. 바이템포럴은 기업이 단일한 핵심 방향으로 데이터 보안을 개선하는 데 도움이 된다. 이력 데이터 관리에 전통적인 접근방식을 활용하는 경우 여러 시점에서 데이터 웨어하우스의 사본을 여러 개 작성하고 이런 데이터를 오프라인 상태로 저장해야 하기 때문이다. 데이터 사본의 수가 늘어나면 더 많은 취약성이 발생한다.

반면 바이템포럴을 이용하면 데이터가 한 곳에 위치하기 때문에 이력 데이터 유지가 간소화되고 단순해진다. 즉, 돌아다니는 모든 데이터의 사본을 추적할 필요가 없기 때문에 전반적인 데이터 거버넌스 향상에 도움이 된다.

바이템포럴 데이터 관리의 장점은 이력 데이터를 단순화하는 것, 그 이상이다. 가장 중요한 것은 이를 통해 전반적으로 강력한 데이터 거버넌스를 갖추는 것이다. 보안과 프라이버시, 계통, 출처, 데이터 품질, 준수성, 라이프 사이클 관리 등 데이터 거버넌스의 모든 측면을 유지하기 위한 전략을 반드시 수립해야 하는 것도 이 때문이다.

Matt Allen은 MarkLogic의 Senior Product Marketing Manager이다. ciokr@idg.co.kr 



2017.04.03

'바이템포럴' 데이터 관리가 필요한 이유

Matt Allen | Network World
* 본 기고문은 벤더가 작성한 것으로 네트워크월드 편집진의 수정을 거쳤다. 그러나 벤더의 시각이 일부 남아 있을 수 있다.

오늘날 데이터베이스는 주된 기록 시스템이며 기업은 이벤트가 발생할 때 정확한 청사진을 보존해야 한다. 그러나 안타깝게도 전통적인 데이터베이스는 일시적이며 다른 시점에서 기업에 대한 정확한 청사진을 제공할 수 없다.



그래서 특히 규제가 심한 업계에서 꼭 필요한 것이 바로 '바이템포럴(Bitemporal)' 데이터 지원이다. 두 개의 타임라인(Timeline)을 따라 실제 세계에서 사실이 발생한 시점('자신이 알던 것')과 시스템 시간 및 사실이 데이터베이스에 기록된 시간('자신이 알았던 시점') 등 유효한 두 시점에 대한 타임스탬프(Timestamp)를 적용해 데이터를 저장 및 질의할 수 있다.

오늘날 점차 많은 기업이 시간 기반의 통찰을 필요로 한다. 이는 이력 데이터를 처리하는 데도 효과적이어서 보안과 데이터 관리가 필요한 기업에도 도움이 된다. 기업은 바이템포럴 데이터베이스를 이용해 과거에 대한 완전하고 정확한 청사진을 유지해 누가 무엇을 알았고 언제 무엇을 했는지 정확히 파악할 수 있다.

바이템포럴 데이터베이스는 시스템과 유효 시간축 전반에 걸쳐 질의 처리가 가능하기 때문에 템포럴(Temporal) 데이터베이스보다 더 강력하다. 손쉽게 시간을 거슬러 올라가 데이터를 검색하고 시스템 전반에 걸쳐 이력 데이터를 관리하고 데이터 무결성을 확보하며 복잡한 바이템포럴 분석을 수행할 수 있다.

예를 들어, “8월 20일에 존 토마스가 살던 곳은?”이라는 질문에는 템포럴 데이터베이스도 답할 수 있다. 하지만 바이템포럴 데이터베이스는 “9월 1일 현재 우리가 알고 있는 8월 20일에 존 토마스가 살던 곳은?”이라는 질문에 답할 수 있다.

이처럼 바이템포럴은 유효한 시스템 시간축에 대한 요소 범위 인덱싱(Indexing)이 적용된 일련의 문서로써 관리되는 바이템포럴 문서를 활용한다. 문서는 보안 권한으로 제어하는 여러 개의 보안 컬렉션에 저장된다. 데이터베이스에 삽입된 초기의 문서를 보존하고 절대로 변경하지 않기 때문에 완전한 거버넌스(Governance) 및 불역성을 통해 정보의 출처를 추적할 수 있다.


바이템포럴 데이터베이스 기술 도입을 판단할 때 검토할 것은 다음과 같다.

- 사업에 대한 이력 데이터 손실을 감당할 수 있는가? 규제 비용이 크고 시간과 비용이 많이 소요되는 시대에 데이터베이스는 주요 기록 시스템이 돼야 한다. 안타깝게도 전통적인 데이터베이스는 과거의 이력을 온전히 보존하지 않으며 데이터를 잃을 수 밖에 없다. 금융 기업이 바이템포럴 기술을 활발하게 사용하는 이유도 이 때문이다. 예를 들어 바이템포럴은 대형 금융 기업이 데이터를 더 잘 관리해 새로운 규정과 감사에 대응하고 위험을 더 잘 관리하는 데 도움이 된다.

- 이력 데이터를 업데이트해야 하는 경우가 있는가? 이력 데이터 업데이트가 필요한 기업은 바이템포럴의 혜택을 누릴 수 있다. 예를 들어 금융 거래 기업에서 거래가 이루어진 후 수정이 가능하다. 이런 변화에 대한 시간 기준 기록이 없다면 미래의 거래 위치 분석에 문제가 생기고 기업은 규제 당국으로부터 높은 벌금을 부과 받을 수 있다. 유니템포럴 데이터베이스를 통한 업데이트는 이력 데이터를 덮어 쓰기 때문에 개인 거래자와 기업 전체에 엄청난 위험이 발생할 수 있다. 반면 바이템포럴 아키텍처는 거래 상대방 이름, 트랜잭션 ID, 가격 수정이 발생하는 때를 포함해 거래 검토의 라이프사이클 전체에 대한 정확한 청사진을 제공한다.

- 규제 당국에 이력 데이터를 제공해야 하는가? 우리는 규제가 강화될 뿐 완화될 조짐이 없는 시대를 살고 있다. 실제로 금융 서비스 부문은 2008년의 금융 위기 이후로 상당한 변화를 추구해야 했고 모든 산업의 기업이 이력 데이터를 처리해야 하는 상황이다. 바이템포럴을 통해 기업은 데이터의 변경사항을 포함해 이력 데이터를 보존할 수 있고 감사 및 기타 목적을 위해 필요할 때 정보를 손쉽게 수집 및 제시할 수 있다.

- 이벤트의 순서와 기록이 보안 및 정보뿐만 아니라 전반적인 전략에 중요한가? 많은 산업에서 바이템포럴 기술의 장점을 누릴 수 있다. 예를 들어, 의료 산업의 경우 환자의 이력에 대한 더 정확한 청사진을 제공해 질병과 선행 사건을 연결하는 데 도움이 된다.

마찬가지로 정부 정보와 사법 기관은 바이템포럴 지원을 통해 데이터베이스를 활용해 겉으로 보기에는 이질적인 데이터를 이해해 동기를 더 잘 파악하고 심지어 미래 상황도 예측할 수 있다. 기업은 이 데이터를 활용해 고객 패턴과 행동을 판단하고 더 전략적으로 신제품과 서비스를 개발할 수 있다.

- 이력 데이터 저장, 접근, 보안의 비용과 복잡성이 증가하고 있는가? 데이터 1기가바이트(Gigabyte)당 비용이 감소하고 있지만 오늘날의 기업은 너무 많은 이력 데이터를 처리하고 있어 저장에 더 큰 비용을 지출하고 있다. 기업은 일반적으로 데이터를 저장해 놓는 경향이 있지만 일부 경우는 규제 때문에라도 필요하다. 바이템포럴 데이터 관리는 이력 데이터를 위한 추가 데이터베이스를 구성할 필요가 없으므로 저장소를 관리하는 데 도움이 된다.

- 데이터베이스 개발자가 점차 이력 데이터 관리, 접근, 보안의 복잡성을 부담스러워하고 있는가? 개발자는 단지 이력 데이터에 손쉽게 접근할 수 있는 쿼리를 작성하기를 바란다. 바이템포럴을 이행하지 않고 중요한 이력 데이터 구성 요소를 추적하지 않는 경우 개발자는 데이터에 대한 구체적인 질문을 던질 수 없다. 또한 전통적인 데이터베이스에서는 다양한 타임라인과 버전을 관리하기가 꽤 복잡해 개발자에게 추가적인 부담을 주지만, 바이템포럴 디자인은 덜 복잡하기 때문에 데이터 접근을 간소화할 수 있다.

- 데이터 거버넌스에 대한 청사진 전체를 고려하고 있는가? 바이템포럴 데이터 관리는 데이터 거버넌스에서 중요하다. 바이템포럴은 기업이 단일한 핵심 방향으로 데이터 보안을 개선하는 데 도움이 된다. 이력 데이터 관리에 전통적인 접근방식을 활용하는 경우 여러 시점에서 데이터 웨어하우스의 사본을 여러 개 작성하고 이런 데이터를 오프라인 상태로 저장해야 하기 때문이다. 데이터 사본의 수가 늘어나면 더 많은 취약성이 발생한다.

반면 바이템포럴을 이용하면 데이터가 한 곳에 위치하기 때문에 이력 데이터 유지가 간소화되고 단순해진다. 즉, 돌아다니는 모든 데이터의 사본을 추적할 필요가 없기 때문에 전반적인 데이터 거버넌스 향상에 도움이 된다.

바이템포럴 데이터 관리의 장점은 이력 데이터를 단순화하는 것, 그 이상이다. 가장 중요한 것은 이를 통해 전반적으로 강력한 데이터 거버넌스를 갖추는 것이다. 보안과 프라이버시, 계통, 출처, 데이터 품질, 준수성, 라이프 사이클 관리 등 데이터 거버넌스의 모든 측면을 유지하기 위한 전략을 반드시 수립해야 하는 것도 이 때문이다.

Matt Allen은 MarkLogic의 Senior Product Marketing Manager이다. ciokr@idg.co.kr 

X