Offcanvas

How To / 빅데이터 | 애널리틱스 / 애플리케이션

'SQL 관계형 데이터베이스를 통해 알아본' OLTP 가이드

2022.02.23 Martin Heller  |  InfoWorld
온라인 트랜잭션 처리(Online Transaction Processing, OLTP)란 ATM 인출과 신용카드 결제, 표 예매 및 예약 시스템, 온라인 쇼핑, 일반 전자상거래를 위한 실시간 데이터 처리를 말한다. OLTP 시스템은 복수의 사용자 PC에서 발생하는 다수의 트랜잭션을 처리할 목적으로 구축된다.
 
ⓒ Getty Images Bank

OLTP 데이터베이스는 전자상거래는 물론, 최신 컴퓨터 애플리케이션 대부분에 백엔드 및 스토리지 계층을 제공한다. OLTP 데이터베이스는 전통적으로 SQL 관계형 데이터베이스였으나 일부 노에스큐엘(NoSQL) 데이터베이스도 동일한 목적으로 사용할 수 있다. 이번 기사에서 설명할 내용은 대부분 SQL 관계형 데이터베이스를 기준으로 한다.
 

OLTP vs. OLAP

OLTP 데이터베이스는 일반적으로 여러 사용자의 작고 빠른 트랜잭션을 처리한다. 이런 트랜잭션은 데이터베이스를 변경하되 트랜잭션 내부에서 CRUD(Create, Read, Update, Delete) 연산을 사용해 일관성을 유지한다. OLTP 데이터베이스가 분석 쿼리를 지원하기도 하는데, 이런 기능은 별도의 온라인 분석 처리(Online Analytical Processing, OLAP) 데이터베이스나 데이터웨어하우스에서 실행되는 경우가 많다. OLTP 데이터베이스는 데이터 수집과 수정에, OLAP 데이터베이스는 분석에 최적화돼 있다.
   

CRUD

CRUD는 기본적인 데이터베이스 연산이다. SQL 데이터베이스에서 INSERT문은 레코드 생성, SELECT문은 레코드 판독, UPDATE문은 레코드 업데이트, 삭제(DELETE)문은 레코드 삭제를 수행한다. 이들 명령문은 데이터 조작 언어(Data Manipulation Language, DML)로 구성돼 있으며, 데이터 정의 언어(Data Definition Language, DDL)를 지원해 데이터베이스와 테이블, 인덱스, 뷰 등의 데이터베이스 객체를 정의한다.
 

데이터베이스 트랜잭션

SQL 데이터베이스에서의 데이터베이스 트랜잭션은 일괄 작업을 각각 확장하고 취소하는 커밋(COMMIT)과 롤백(ROLLBACK)이라는 두 가지 가능한 종단점이 있는 일련의 SQL문을 위한 래퍼이다. 예를 들어, 은행 송금은 한 계좌에서 돈을 인출한 후 동일한 금액을 다른 계좌에 입금하는 작업이다. 인출과 입금이 둘 다 성공하면 트랜잭션은 확정된다. 둘 중 하나가 실패하면 해당 트랜잭션은 모두 취소되고 트랜잭션이 시작되기 전인 롤백 상태로 돌아간다. 따라서 두 계좌의 자금 총액은 일정하다.
 

ACID 데이터베이스 속성

데이터베이스 트랜잭션에는 ACID(Atomicity, Consistency, Isolation, Durability) 속성이 전부 나타나야 한다. 원자성(Atomicity)은 앞서 설명한 것처럼, 트랜잭션 커밋과 롤백으로 보장된다. 전체 트랜잭션이 원자처럼 더 이상 나뉠 수 없는 하나의 연산으로 취급된다.

일관성(Consistency)은 트랜잭션을 적절히 실행한 최종 결과물이다. 즉, 송금과 연관된 계좌 내 자금 총액이 일정하다. 고립성(Isolation)은 한 트랜잭션의 중간 상태를 다른 트랜잭션이 탐지할 수 없다는 것을 의미한다. 지속성(Durability)은 일단 트랜잭션이 확정되면 심지어 시스템 오류가 발생해도 새로운 값을 취소할 수 없는 것을 말한다.

ACID 속성은 중앙집중화 데이터베이스에서 쉽게 보장된다. 클러스터화나 분산 데이터베이스에서는 상대적으로 보장되기 어렵다.

예를 들어, 일부 분산 데이터베이스는 ‘최종 일관성’만 주장하기 때문에 모든 데이터베이스 노드의 쓰기 작업이 완료되기 전에 트랜잭션이 확정되었다고 말할 수 있다. 그 결과 분산 트랜잭션의 속도가 높아지는 반면, 일관성을 기대하는 나중의 트랜잭션은 모든 쓰기 작업이 완료되기를 기다리거나 트랜잭션의 원래 위치에서 판독 작업을 해야 한다.

‘강력한 일관성’을 보장하는 분산 데이터베이스는 최종 일관성을 제공하는 데이터베이스에 비해 트랜잭션 지연이 높을 수 있다. 예를 들어, 이전 트랜잭션이 모든 위치에서 쓰기 작업을 끝내기 전에 원격 판독이 완료되는 경우 애플리케이션 버그를 야기할 가능성은 훨씬 낮다.
 

트랜잭션 지연

지연은 데이터베이스의 반응 시간과 애플리케이션의 종단 간 반응 시간 모두를 지칭한다. 트랜잭션 지연은 트랜잭션의 시작부터 확정까지의 시간을 말한다.
 

OLTP용 데이터베이스 스키마

높은 트랜잭션 속도를 지원하기 위해 OLTP 데이터베이스용 데이터베이스 스키마에는 주로 크기가 작은 행과 최소한의 인덱스가 사용된다. 이를 위해 과거에는 데이터베이스 스키마가 반드시 제3정규형이었다.
 

제3정규형

제3정규형(3NF)은 데이터 중복 감소와 데이터 이상 방지, 참조 무결성 보장, 데이터 관리 간소화 등을 위해 에드거 F. 커드가 1971년에 규정한 데이터베이스 스키마 요건이다. 기본적으로 테이블 필드에는 기본 키 속성이 아닌 것이 포함될 수 없다.

예를 들어, 환자 테이블의 기본 키가 환자 번호라면 이 테이블의 필드에는 환자 외에 병원이나 의사, 보험사와 관련된 내용은 포함될 수 없다. 단, 이들 내용에 대한 다른 테이블의 참조(외래 키)는 포함될 수 있다. 빌 켄트는 3NF에 대해 “모든 비식별자 속성은 더도 덜도 아닌 오직 식별자에 대한 사실만을 제공해야 한다”라고 요약했다.
 

NoSQL 데이터베이스의 OLTP 기능 수행 가능 여부

지금까지 주로 다룬 것은 일관성이 강한 관계형 데이터베이스이지만, NoSQL 데이터베이스 중에도 OLTP용으로 설계된 것이 분명히 존재한다. 트랜잭션 처리에 NoSQL 데이터베이스가 필요한 상황이라면 ACID 속성이 있는 것으로 한정해야 한다. OLTP, 특히 금융 애플리케이션에 사용할 경우 최종 일관성만 제공하는 데이터베이스는 피해야 한다. 금융 트랜잭션 처리에 사용할 데이터베이스는 확정하기에 앞서 반드시 사전에 담당 감사관과 확인해야 한다.
 

OLTP 성능 측정

관계형 데이터베이스가 나온 지 얼마 안 됐을 때 모든 업체가 저마다 자사 제품에 맞게 수정한 트랜잭션 처리 성능 벤치마크를 내세웠다. 이에 업체 중립적인 벤치마크를 만들고 감사할 트랜잭션 처리 성능 평의회(TPPC)가 결성됐다. TPC 벤치마크 C(TPC-C)는 널리 사용되는 OLTP 벤치마크이다. 다른 공용 데이터베이스 벤치마크 중에 사용자에 해당되는 것을 활용해도 되고, 사용자가 직접 만들어도 된다. 단, 실제 사용을 반영하는 정직한 벤치마크를 만들어 실행하는 작업은 의외로 까다롭다.

종합하면 OLTP 데이터베이스는 트랜잭션을 빠르고 지속적으로 기록한다는 본연의 임무만 수행하면 된다. 분석 용도로는 별도의 데이터 레이크 및 데이터 웨어하우스와 ETL 및 ETL 프로세스를 설정해 OLTP 데이터베이스에서 분석 데이터베이스를 채우는 방안을 고려해야 한다. OLTP와 OLAP는 별개이기 때문이다.
editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.