Offcanvas

RDBMS

'NoSQL을 넘는다' 분산 SQL의 당위성

처음에는 파일이 있었다. 이후 구조적 파일을 기반으로 한 탐색형 데이터베이스가 나왔다. 그 다음으로 IMS와 CODASYL에 이어 약 40년 전에 최초의 관계형 데이터베이스가 등장했다. 1980년대와 1990년대에 걸쳐 “데이터베이스”는 곧 “관계형 데이터베이스”를 의미했다. SQL이 지배했던 시기다. 이후 객체 지향 프로그래밍 언어가 인기를 끌자 객체 지향 언어와 관계형 데이터베이스 간의 “임피던스 불일치”에 대한 해결책은 데이터베이스에 객체를 매핑하는 것이라고 생각하는 사람들이 나타났다. 그 결과로 나온 것이 “객체 지향 데이터베이스”다. 객체 데이터베이스에서 재미있는 점은 많은 경우 기본적으로 일반 데이터베이스에 객체 매퍼가 내장된 형태였다는 것이다. 이와 같은 데이터베이스의 인기가 식은 후 등장한 진정한 보편적 솔루션이 바로 2010년대의 “NoSQL”이다.     SQL에 대한 공격 NoSQL은 같은 맥락에서 관계형 데이터베이스와 SQL을 모두 공격했다. 이 당시의 가장 큰 문제는 인터넷이 40년 된 관계형 데이터베이스 관리 시스템(RDBMS) 아키텍처의 기반 전제를 무너뜨렸다는 것이다. 이들 데이터베이스는 귀중한 디스크 공간을 절약하고 수직으로 확장되도록 만들어진 것이다.  그런데 사용자 수가 너무 많아져서 하나의 대형 서버로는 감당할 수 없게 됐다. NoSQL 데이터베이스의 중심 개념은 조인(join)이 없고 표준 쿼리 언어도 없고(SQL 구현에는 시간이 소요되므로) 데이터 무결성도 없는 데이터베이스가 있다면, 수평 확장이 가능하고 막대한 볼륨의 데이터를 처리할 수 있다는 것이다. 이렇게 해서 수직 확장의 문제는 해결됐지만 대신 새로운 문제가 발생했다. 온라인 트랜잭션 처리 시스템(OLTP)과 함께 온라인 분석 처리 시스템(OLAP)으로 불린 또 다른 형태의 관계형 데이터베이스가 개발됐다. OLAP 데이터베이스는 관계형 구조를 지원했지만 방대한 데이터가 반환된다는 점을 전제로 쿼리를 실행했다. 1980년대와 19...

NoSQL 데이터베이스 객체지향 SQL RDBMS

2020.07.23

처음에는 파일이 있었다. 이후 구조적 파일을 기반으로 한 탐색형 데이터베이스가 나왔다. 그 다음으로 IMS와 CODASYL에 이어 약 40년 전에 최초의 관계형 데이터베이스가 등장했다. 1980년대와 1990년대에 걸쳐 “데이터베이스”는 곧 “관계형 데이터베이스”를 의미했다. SQL이 지배했던 시기다. 이후 객체 지향 프로그래밍 언어가 인기를 끌자 객체 지향 언어와 관계형 데이터베이스 간의 “임피던스 불일치”에 대한 해결책은 데이터베이스에 객체를 매핑하는 것이라고 생각하는 사람들이 나타났다. 그 결과로 나온 것이 “객체 지향 데이터베이스”다. 객체 데이터베이스에서 재미있는 점은 많은 경우 기본적으로 일반 데이터베이스에 객체 매퍼가 내장된 형태였다는 것이다. 이와 같은 데이터베이스의 인기가 식은 후 등장한 진정한 보편적 솔루션이 바로 2010년대의 “NoSQL”이다.     SQL에 대한 공격 NoSQL은 같은 맥락에서 관계형 데이터베이스와 SQL을 모두 공격했다. 이 당시의 가장 큰 문제는 인터넷이 40년 된 관계형 데이터베이스 관리 시스템(RDBMS) 아키텍처의 기반 전제를 무너뜨렸다는 것이다. 이들 데이터베이스는 귀중한 디스크 공간을 절약하고 수직으로 확장되도록 만들어진 것이다.  그런데 사용자 수가 너무 많아져서 하나의 대형 서버로는 감당할 수 없게 됐다. NoSQL 데이터베이스의 중심 개념은 조인(join)이 없고 표준 쿼리 언어도 없고(SQL 구현에는 시간이 소요되므로) 데이터 무결성도 없는 데이터베이스가 있다면, 수평 확장이 가능하고 막대한 볼륨의 데이터를 처리할 수 있다는 것이다. 이렇게 해서 수직 확장의 문제는 해결됐지만 대신 새로운 문제가 발생했다. 온라인 트랜잭션 처리 시스템(OLTP)과 함께 온라인 분석 처리 시스템(OLAP)으로 불린 또 다른 형태의 관계형 데이터베이스가 개발됐다. OLAP 데이터베이스는 관계형 구조를 지원했지만 방대한 데이터가 반환된다는 점을 전제로 쿼리를 실행했다. 1980년대와 19...

2020.07.23

RDBMS·NoSQL 장점만 모았다··· '분산 관계형' 데이터베이스 5종

1980년대부터 써온 관계형 SQL 데이터베이스는 흔히 중앙 처리 장치나 단일 서버에서 실행됐다. 그것밖에 없었기 때문이다.   당시에는 데이터베이스의 처리 데이터양이나 실행 속도를 개선하려면 성능이 더 좋고 더 많은 CPU, 메모리, 디스크가 있는 더 큰 서버에 데이터베이스를 배치해야 했다. 즉, 수직 확장성, 즉, '스케일 업(Scale-Up)'에 의존했다. 여기서 가용성 개선을 위해 수동 전환 기능이 필요하다면, 핫 백업 서버와 활성 서버를 '액티브-패시브' 클러스터에 함께 배치했는데, 이때는 공유 스토리지를 이용하는 것이 일반적이다.   네트워크 분할, 정전 등의 오류 시에도 데이터베이스 트랜잭션이 항시 제대로 수행되게 하려면 4가지 ACID 속성(원자성(A), 일관성(C), 고립성(I), 지속성(D))이 준수돼야 한다. 이 ACID 측면에서 단일 서버에 있는 데이터베이스는 ACID 속성을 전부 만족하기가 비교적 쉽다. 반면 분산 데이터베이스는 이행하기가 약간 더 까다롭다. 실제로 2009년경부터 확산한 NoSQL 데이터베이스는 '수평 확장성(Scale-Out, 다수의 서버에서 실행 가능하다는 의미)'의 장점이 있었지만 ACID 전체를 따르지 못하는 경우가 많았다. 또한 독자적인 SQL 언어를 쓰는 경우도 많았다.   이는 NoSQL 데이터베이스가 개념부터 달랐기 때문이다. 즉 '궁극적 일관성'이라는 개념을 사용했다. 한 서버의 데이터베이스에 작성한 내용을 즉시 다른 서버로부터 읽으면 방금 작성한 서버로부터 읽는 것과는 같은 결과를 보지 못할 수도 있다는 의미다. 물론 조금 시간이 지나면 새로운 데이터가 클러스터 내 모든 서버에 복제되고 궁극적으로 일관성을 갖게 된다. 이러한 '궁극적 일관성' 개념은 온라인 카탈로그와 같은 일부 애플리케이션에서는 충분히 효과적이지만 재무 데이터까지 적용하기에는 부족했다.   이런 가운데 최근 수평으로 확장 가능한 '스케일 아웃' SQL 데이터베이스가 새롭게 부상하고 있다. 가장...

데이터베이스 RDBMS NoSQL 분산 관계형 DBMS

2019.07.10

1980년대부터 써온 관계형 SQL 데이터베이스는 흔히 중앙 처리 장치나 단일 서버에서 실행됐다. 그것밖에 없었기 때문이다.   당시에는 데이터베이스의 처리 데이터양이나 실행 속도를 개선하려면 성능이 더 좋고 더 많은 CPU, 메모리, 디스크가 있는 더 큰 서버에 데이터베이스를 배치해야 했다. 즉, 수직 확장성, 즉, '스케일 업(Scale-Up)'에 의존했다. 여기서 가용성 개선을 위해 수동 전환 기능이 필요하다면, 핫 백업 서버와 활성 서버를 '액티브-패시브' 클러스터에 함께 배치했는데, 이때는 공유 스토리지를 이용하는 것이 일반적이다.   네트워크 분할, 정전 등의 오류 시에도 데이터베이스 트랜잭션이 항시 제대로 수행되게 하려면 4가지 ACID 속성(원자성(A), 일관성(C), 고립성(I), 지속성(D))이 준수돼야 한다. 이 ACID 측면에서 단일 서버에 있는 데이터베이스는 ACID 속성을 전부 만족하기가 비교적 쉽다. 반면 분산 데이터베이스는 이행하기가 약간 더 까다롭다. 실제로 2009년경부터 확산한 NoSQL 데이터베이스는 '수평 확장성(Scale-Out, 다수의 서버에서 실행 가능하다는 의미)'의 장점이 있었지만 ACID 전체를 따르지 못하는 경우가 많았다. 또한 독자적인 SQL 언어를 쓰는 경우도 많았다.   이는 NoSQL 데이터베이스가 개념부터 달랐기 때문이다. 즉 '궁극적 일관성'이라는 개념을 사용했다. 한 서버의 데이터베이스에 작성한 내용을 즉시 다른 서버로부터 읽으면 방금 작성한 서버로부터 읽는 것과는 같은 결과를 보지 못할 수도 있다는 의미다. 물론 조금 시간이 지나면 새로운 데이터가 클러스터 내 모든 서버에 복제되고 궁극적으로 일관성을 갖게 된다. 이러한 '궁극적 일관성' 개념은 온라인 카탈로그와 같은 일부 애플리케이션에서는 충분히 효과적이지만 재무 데이터까지 적용하기에는 부족했다.   이런 가운데 최근 수평으로 확장 가능한 '스케일 아웃' SQL 데이터베이스가 새롭게 부상하고 있다. 가장...

2019.07.10

RDB부터 검색엔진까지··· 내게 꼭 맞는 DB 고르기

기술적 내용이 많은 데이터베이스 사용기는 수백 건이 나와 있지만, 데이터베이스 선택의 첫번째 단계를 명확히 알려주는 글은 별로 없다. 원칙은 특정 응용프로그램에 가장 적합한 일반 유형을 선택하는 것이다. 모든 데이터베이스는 각자 강점과 약점이 있다. 원하는 데이터베이스를 쓸 수 있게 하는 편법이 있지만, 이렇게 사용하다 보면 쓸데없이 복잡해진다. 따라서 특정 데이터베이스를 고려하기에 앞서, 현재 프로젝트를 가장 잘 지원할 유형이 무엇인지 곰곰이 생각해야 한다. “SQL이냐 NoSQL이냐”라는 것보다 훨씬 더 심도 있는 문제이기 때문이다. 가장 일반적인 데이터베이스 유형은 관계형 데이터베이스, 문서 저장소, 키값 저장소, 와이드 칼럼 저장소, 검색 엔진 등이다. 이제 각 데이터베이스의 장점과 나에게 맞는 데이터베이스 선택법을 살펴보자. 관계형 데이터베이스 관리 시스템(오라클, 마이SQL, MS 서버, 포스트그리SQL) 관계형 데이터베이스는 늘어나는 데이터를 처리하기 위해 1970년도에 개발됐다. 탄탄한 기본 이론을 갖고 있으며 오늘날 사용 중인 거의 모든 데이터베이스 시스템에 영향을 미쳤다. 관계형 데이터베이스는 데이터 집합을 “관계”로 저장한다. 모든 정보가 특정 셀의 값으로 저장되는 행과 열을 갖춘 테이블 형태다. 관계형 데이터베이스 관리 시스템(RDBMS)에 있는 데이터는 SQL을 사용해 관리된다. 여러 가지 다른 버전이 있지만 SQL이 표준화돼 있고 일정 수준의 예측 가능성과 유용성을 제공한다. 초기에 쏟아져 나온 업체가 관계형이라고 볼 수 없는 제품을 잇달아 내놓자 에드거 F.커드가 모든 관계형 데이터 베이스 관리 시스템이 따라야 할 일정한 규칙을 제시했다. 커드의 12가지 규칙은 엄격한 내부 구조 프로토콜을 실시하고, 검색 결과 요청한 데이터가 안정적으로 반환되며, 구조 변경(최소한 사용자에 의한 변경)을 방지하는 것이 주 목적이다. 이러한 체계 덕분에 오늘날까지 관계형 데이터베이스는...

개발자 데이터베이스 검색엔진 RDBMS 키값스토어

2018.04.25

기술적 내용이 많은 데이터베이스 사용기는 수백 건이 나와 있지만, 데이터베이스 선택의 첫번째 단계를 명확히 알려주는 글은 별로 없다. 원칙은 특정 응용프로그램에 가장 적합한 일반 유형을 선택하는 것이다. 모든 데이터베이스는 각자 강점과 약점이 있다. 원하는 데이터베이스를 쓸 수 있게 하는 편법이 있지만, 이렇게 사용하다 보면 쓸데없이 복잡해진다. 따라서 특정 데이터베이스를 고려하기에 앞서, 현재 프로젝트를 가장 잘 지원할 유형이 무엇인지 곰곰이 생각해야 한다. “SQL이냐 NoSQL이냐”라는 것보다 훨씬 더 심도 있는 문제이기 때문이다. 가장 일반적인 데이터베이스 유형은 관계형 데이터베이스, 문서 저장소, 키값 저장소, 와이드 칼럼 저장소, 검색 엔진 등이다. 이제 각 데이터베이스의 장점과 나에게 맞는 데이터베이스 선택법을 살펴보자. 관계형 데이터베이스 관리 시스템(오라클, 마이SQL, MS 서버, 포스트그리SQL) 관계형 데이터베이스는 늘어나는 데이터를 처리하기 위해 1970년도에 개발됐다. 탄탄한 기본 이론을 갖고 있으며 오늘날 사용 중인 거의 모든 데이터베이스 시스템에 영향을 미쳤다. 관계형 데이터베이스는 데이터 집합을 “관계”로 저장한다. 모든 정보가 특정 셀의 값으로 저장되는 행과 열을 갖춘 테이블 형태다. 관계형 데이터베이스 관리 시스템(RDBMS)에 있는 데이터는 SQL을 사용해 관리된다. 여러 가지 다른 버전이 있지만 SQL이 표준화돼 있고 일정 수준의 예측 가능성과 유용성을 제공한다. 초기에 쏟아져 나온 업체가 관계형이라고 볼 수 없는 제품을 잇달아 내놓자 에드거 F.커드가 모든 관계형 데이터 베이스 관리 시스템이 따라야 할 일정한 규칙을 제시했다. 커드의 12가지 규칙은 엄격한 내부 구조 프로토콜을 실시하고, 검색 결과 요청한 데이터가 안정적으로 반환되며, 구조 변경(최소한 사용자에 의한 변경)을 방지하는 것이 주 목적이다. 이러한 체계 덕분에 오늘날까지 관계형 데이터베이스는...

2018.04.25

'대규모 데이터 정리의 시작' 엑셀에서 RDB 만들기

엑셀은 놀라울 정도의 데이터베이스 파워를 지니고 있다. 관계형 데이터베이스를 생성하기 위해서는 하위 테이블과 연결되는 마스터 테이블부터 시작해야 한다. 마스터 테이블은 슬레이브(Slave), 차일드(Child), 그리고 디테일(Detail) 테이블로 불린다. 보다 구체적인 내용을 알아보기 전에, 관계형 데이터베이스 생성을 위한 각 단계별 설명과 연습을 해 볼 수 있는 통합문서를 준비했다. 화살표를 클릭하거나, 아래의 링크를 누르면 다운로드 받을 수 있다. 예제 통합 문서 다운로드 하기  관계형 데이터베이스란? 엑셀은 구조부터 데이터베이스 생성에 적합하다. 데이터베이스란 기본적으로 연결된 아이템들(스프레드시트)의 조합인데 이들이 연합하여 다수의 레코드(테이블) 그룹 내에 단일 레코드(열)를 생성하게 된다. 스프레트시트 한 장이라도 그 자체로 데이터베이스라고 부를 수는 있지만, 관계형 데이터베이스는 아니다. 관계형 데이터베이스는 마스터 스프레드시트 테이블과 그 하위 슬레이브 테이블 또는 슬레이브 스프레드시트 전부를 포괄하는 개념이다. 예를 들어 운전면허가 차량국 컴퓨터에 저장된 플랫 파일 데이터베이스 상의 하나의 레코드라고 해 보자. 면허증에는 나의 이름, 성별, 신장, 체중, 눈동자 색, 머리 색, 주소, 생년월일, 면허증 발급 및 만료일 등의 정보가 담겨 있다. 그렇지만 이름, 주소, 성별이 같은 사람은 여러 명이 있을 수 있기 때문에, 면허증에는 항상 면허 번호가 함께 기재 돼 있다. 한 사람당 하나씩만 부여 되는 이 고유 번호는 키 필드(Key Field)라 불리며 플랫 파일 데이터베이스를 다른 관련 데이터베이스 들(관계형 데이터베이스 들)과 연결시키는 역할을 한다. (이 예시에서 사용된) 이러한 마스터 데이터베이스(MasterDB 탭)는 운전 면허증에 담긴 모든 정보를 포함하고 있다. 슬레이브, 차일드, 그리고 디테일 데이터베이스 등으로 불리는 하나 이상의 관계형 데이터...

RDBMS 엑셀 관계형데이터베이스

2018.03.23

엑셀은 놀라울 정도의 데이터베이스 파워를 지니고 있다. 관계형 데이터베이스를 생성하기 위해서는 하위 테이블과 연결되는 마스터 테이블부터 시작해야 한다. 마스터 테이블은 슬레이브(Slave), 차일드(Child), 그리고 디테일(Detail) 테이블로 불린다. 보다 구체적인 내용을 알아보기 전에, 관계형 데이터베이스 생성을 위한 각 단계별 설명과 연습을 해 볼 수 있는 통합문서를 준비했다. 화살표를 클릭하거나, 아래의 링크를 누르면 다운로드 받을 수 있다. 예제 통합 문서 다운로드 하기  관계형 데이터베이스란? 엑셀은 구조부터 데이터베이스 생성에 적합하다. 데이터베이스란 기본적으로 연결된 아이템들(스프레드시트)의 조합인데 이들이 연합하여 다수의 레코드(테이블) 그룹 내에 단일 레코드(열)를 생성하게 된다. 스프레트시트 한 장이라도 그 자체로 데이터베이스라고 부를 수는 있지만, 관계형 데이터베이스는 아니다. 관계형 데이터베이스는 마스터 스프레드시트 테이블과 그 하위 슬레이브 테이블 또는 슬레이브 스프레드시트 전부를 포괄하는 개념이다. 예를 들어 운전면허가 차량국 컴퓨터에 저장된 플랫 파일 데이터베이스 상의 하나의 레코드라고 해 보자. 면허증에는 나의 이름, 성별, 신장, 체중, 눈동자 색, 머리 색, 주소, 생년월일, 면허증 발급 및 만료일 등의 정보가 담겨 있다. 그렇지만 이름, 주소, 성별이 같은 사람은 여러 명이 있을 수 있기 때문에, 면허증에는 항상 면허 번호가 함께 기재 돼 있다. 한 사람당 하나씩만 부여 되는 이 고유 번호는 키 필드(Key Field)라 불리며 플랫 파일 데이터베이스를 다른 관련 데이터베이스 들(관계형 데이터베이스 들)과 연결시키는 역할을 한다. (이 예시에서 사용된) 이러한 마스터 데이터베이스(MasterDB 탭)는 운전 면허증에 담긴 모든 정보를 포함하고 있다. 슬레이브, 차일드, 그리고 디테일 데이터베이스 등으로 불리는 하나 이상의 관계형 데이터...

2018.03.23

SAP HANA, S/4HANA, HANA 클라우드 플랫폼, 뭐가 다르지?

SAP가 2015년 차세대 ERP 솔루션인 S/4HANA를 발표했을 때 CEO인 빌 맥더못이 23년 만의 가장 큰 출시라며 높이 평가했다. 그 후 2년 동안 SAP는 S/4HAN를 공급했는데, S/4HANA와 인메모리시스템인 HANA가 널리 채택됨에 따라 고객들 사이에 혼란이 빚어지고 있다.  HANA는 새로운 유형의 데이터베이스며, S/4HANA는 메모리 내 데이터베이스를 기반으로 실행되는 ERP다. 이 솔루션 중 하나 또는 둘 다를 SAP의 관리형 프라이빗 클라우드 플랫폼이나 AWS, 애저, 구글 클라우드 등의 퍼블릭 클라우드, 또는 온프레미스 형 데이터센터에서 실행할 수 있다. 2010년에 처음 출시된 SAP의 HANA는 기존 관계형 데이터베이스와 근본적으로 다른 아키텍처라는 점에 유의해야 한다. 이는 메모리 내에서 실행되므로 데이터가 로(row) 대신 칼럼(column)에 저장되므로 실시간 분석 및 컴퓨팅 기능에 더 빨리 근접할 수 있다. 과거에 SAP는 HANA가 무엇이며, 중요한 기업 데이터를 왜 이 새로운 데이터 저장소로 옮겨야 하는지를 설명하는 데 어려움이 있었다. 2015년 프랑스 니스에서 열린 SAP 인사이더 투어에서 SAP 크로스 플랫폼 제품 마케팅 담당 부사장인 매티아스 핸들리는 “HANA에 대해 헷갈리는 부분이 있다. 우리는 현재 각각의 제품이 고객을 위해 무엇을 할 수 있는지 정확히 설명할 수 있다"고 <컴퓨터월드UK>에 밝힌 바 있다. 그 후 2016년 영국 및 아일랜드 SAP 사용자 그룹 회의에서 필립 애덤스 회장은 “사용자 그룹의 12%가 S/4HANA에 대해 들어 본 적이 없다”며 "예전에는 나도 헷갈렸다. SAP 마케팅팀에서 고민이 많았던 것으로 안다"고 말했다. 현재 SAP의 2017년 2분기 결과에 따르면 S4/HANA를 도입한 고객 수는 지난해 같은 기간보다 70% 나 증가했으며, 구글과 에너지 거물인 센트...

구글 인메모리시스템 S/4HANA 관계형 데이터베이스 퍼블릭 클라우드 HANA RDBMS 프라이빗 클라우드 온프레미스 애저 AWS ERP 데이터베이스 SAP HANA 클라우드 플랫폼

2017.07.31

SAP가 2015년 차세대 ERP 솔루션인 S/4HANA를 발표했을 때 CEO인 빌 맥더못이 23년 만의 가장 큰 출시라며 높이 평가했다. 그 후 2년 동안 SAP는 S/4HAN를 공급했는데, S/4HANA와 인메모리시스템인 HANA가 널리 채택됨에 따라 고객들 사이에 혼란이 빚어지고 있다.  HANA는 새로운 유형의 데이터베이스며, S/4HANA는 메모리 내 데이터베이스를 기반으로 실행되는 ERP다. 이 솔루션 중 하나 또는 둘 다를 SAP의 관리형 프라이빗 클라우드 플랫폼이나 AWS, 애저, 구글 클라우드 등의 퍼블릭 클라우드, 또는 온프레미스 형 데이터센터에서 실행할 수 있다. 2010년에 처음 출시된 SAP의 HANA는 기존 관계형 데이터베이스와 근본적으로 다른 아키텍처라는 점에 유의해야 한다. 이는 메모리 내에서 실행되므로 데이터가 로(row) 대신 칼럼(column)에 저장되므로 실시간 분석 및 컴퓨팅 기능에 더 빨리 근접할 수 있다. 과거에 SAP는 HANA가 무엇이며, 중요한 기업 데이터를 왜 이 새로운 데이터 저장소로 옮겨야 하는지를 설명하는 데 어려움이 있었다. 2015년 프랑스 니스에서 열린 SAP 인사이더 투어에서 SAP 크로스 플랫폼 제품 마케팅 담당 부사장인 매티아스 핸들리는 “HANA에 대해 헷갈리는 부분이 있다. 우리는 현재 각각의 제품이 고객을 위해 무엇을 할 수 있는지 정확히 설명할 수 있다"고 <컴퓨터월드UK>에 밝힌 바 있다. 그 후 2016년 영국 및 아일랜드 SAP 사용자 그룹 회의에서 필립 애덤스 회장은 “사용자 그룹의 12%가 S/4HANA에 대해 들어 본 적이 없다”며 "예전에는 나도 헷갈렸다. SAP 마케팅팀에서 고민이 많았던 것으로 안다"고 말했다. 현재 SAP의 2017년 2분기 결과에 따르면 S4/HANA를 도입한 고객 수는 지난해 같은 기간보다 70% 나 증가했으며, 구글과 에너지 거물인 센트...

2017.07.31

오라클·IBM·MS 독점 잠식하는 NoSQL…"매출 낮아도 인기는 급성장 중"

세계 제패에는 아주 오랜 시간이 걸리는 것 같다. 2014년 네트워크 월드의 브랜든 버틀러는 NoSQL이 "SQL 데이터베이스 공급업체와 사용자들을 공포에 떨게 하고 있다"고 말했고, 1년 뒤 인포월드의 앤디 올리버는 "NoSQL이 대중적인 도입 단계에 이르면서 한때 최신 유행이었던 데이터베이스 기술이 매력을 잃고 지루한 주류 기술이 되고 있다"고 말했다. 하지만 지금도 관계형 데이터베이스 업체들은 돈을 끌어 모으는 반면, 대부분이 오픈 소스인 NoSQL 쪽은 그렇지 못하다. 그러나 SQL을 장악하고 있는 업체들의 신경도 조금은 곤두서 있을 법하다. 가트너가 새로 발표한 보고서를 보면 NoSQL은 오랜 전통의 RDBMS 경쟁자들을 계속 성가시게 하는 중이다. 가트너 분석가 머브 아드리안은 "지난 5년 동안 초대형 공급업체들의 전체적인 점유율은 떨어졌다"고 전했다. 다만 하락 폭은 2%에 불과해서 지금도 이들은 89%라는 압도적인 시장 점유율을 차지하고 있다. 5년 사이 2% 하락이라고 하면 별 감흥이 없지만 그 사이 시장 지배적인 공급업체들이 고객에게 최고의 RDBMS와 NoSQL를 제공하는 듯한 인상을 주기 위해 각자의 제품에 상당한 "NoSQL 덧입히기" 작업을 해왔음을 감안해야 한다. 왜일까? 매출을 기준으로 하는 가트너의 시장 점유율 수치에는 잘 나타나지 않지만 NoSQL과 같은 현대적인 데이터 인프라로의 전환에는 수백억 달러를 훨씬 상회하는 가치가 걸려 있기 때문이다. SQL에 만족하는가? 엔터프라이즈 데이터 관리는 큰 시장이고 매년 더 커지고 있다. 2015년 가트너가 추산한 DBMS 시장 규모는 359억 달러로, 2014년의 331억 달러에서 8.7% 증가했다(2014년은 2013년에 비해 8.9% 증가). 이 막대한 돈방석에 함께 올라앉아 있는 오라클, 마이크로소프트, IBM에게는 좋은 소식이다. 그러나 나쁜 소식은 그 지배력이 조금씩이나마 떨어지...

RDBMS NoSQL 카산드라 몽고DB 카우치베이스

2016.04.20

세계 제패에는 아주 오랜 시간이 걸리는 것 같다. 2014년 네트워크 월드의 브랜든 버틀러는 NoSQL이 "SQL 데이터베이스 공급업체와 사용자들을 공포에 떨게 하고 있다"고 말했고, 1년 뒤 인포월드의 앤디 올리버는 "NoSQL이 대중적인 도입 단계에 이르면서 한때 최신 유행이었던 데이터베이스 기술이 매력을 잃고 지루한 주류 기술이 되고 있다"고 말했다. 하지만 지금도 관계형 데이터베이스 업체들은 돈을 끌어 모으는 반면, 대부분이 오픈 소스인 NoSQL 쪽은 그렇지 못하다. 그러나 SQL을 장악하고 있는 업체들의 신경도 조금은 곤두서 있을 법하다. 가트너가 새로 발표한 보고서를 보면 NoSQL은 오랜 전통의 RDBMS 경쟁자들을 계속 성가시게 하는 중이다. 가트너 분석가 머브 아드리안은 "지난 5년 동안 초대형 공급업체들의 전체적인 점유율은 떨어졌다"고 전했다. 다만 하락 폭은 2%에 불과해서 지금도 이들은 89%라는 압도적인 시장 점유율을 차지하고 있다. 5년 사이 2% 하락이라고 하면 별 감흥이 없지만 그 사이 시장 지배적인 공급업체들이 고객에게 최고의 RDBMS와 NoSQL를 제공하는 듯한 인상을 주기 위해 각자의 제품에 상당한 "NoSQL 덧입히기" 작업을 해왔음을 감안해야 한다. 왜일까? 매출을 기준으로 하는 가트너의 시장 점유율 수치에는 잘 나타나지 않지만 NoSQL과 같은 현대적인 데이터 인프라로의 전환에는 수백억 달러를 훨씬 상회하는 가치가 걸려 있기 때문이다. SQL에 만족하는가? 엔터프라이즈 데이터 관리는 큰 시장이고 매년 더 커지고 있다. 2015년 가트너가 추산한 DBMS 시장 규모는 359억 달러로, 2014년의 331억 달러에서 8.7% 증가했다(2014년은 2013년에 비해 8.9% 증가). 이 막대한 돈방석에 함께 올라앉아 있는 오라클, 마이크로소프트, IBM에게는 좋은 소식이다. 그러나 나쁜 소식은 그 지배력이 조금씩이나마 떨어지...

2016.04.20

'클라우드용 DBMS는 따로 있다' 데이터스택스의 도전

데이터스택스가 다양한 데이터 모델을 위해 키 값부터 태뷸러, 제이슨(JSON), 그래프까지 운영 데이터베이스 지원을 강화하고 있으며, 자사 제품군에 데이터스택스 엔터프라이즈 그래프를 추가했다. 아파치 카산드라와 아파치 팅커팝의 오픈소스재단에 구축된 클라우드 애플리케이션용 데이터베이스 소프트웨어 전문업체인 데이터스택스(DataStax)는 데이터 문제에 대한 포인트 솔루션의 시대가 지나갔다는 주장을 내놨다. 미국 캘리포니아 산타클라라에 있는 신생벤처인 데이터스택스의 엔지니어링 담당 수석 부사장 마틴 반 라이스윅은 “대신 운영 DBMS의 미래는 다양한 데이터 모델을 지원하는 것”이라고 밝혔다. 그는 “아주 놀라운 새 기술로 사람들은 이전까지 해결하지 못했던 문제들을 해결하기 위해 처음에는 포인트 솔루션을 사용하려 한다. 하지만 시간이 지나면 통합 제품군을 원한다”며 “현재 우리가 보는 추세는 진정세에 가깝다. 사람들은 수많은 문제 공간을 보완할 수 있는 플랫폼을 원한다”고 말했다. 가트너 애널리스트 닉 휴데커, 머브 애드리안, 에티샴 자이디도 반 라이스윅과 비슷한 의견을 이미 내놓은 바 있다. 이들 셋은 작년 8월에 발표한 ‘NoSQL DBMS의 시장 가이드’에서 “DBMS 아키텍처와 배치의 미래는 멀티 모델이 될 것이다”고 적었다. 또 가트너 세 애널리스트들은 “2017년까지 모든 선도적 운영 DBMS가 멀티 데이터 모델, 관계형 DBMS, NoSQL을 단일 플랫폼에서 제공할 것”이라고 덧붙였다. --------------------------------------------------------------- 클라우드용 데이터베이스 ->벤더 기고 | 하이브리드 클라우드에 맞는 데이터베이스란? 따져봐야 할 3가지 -> '빅데이터와 궁합 잘 맞는' 최신 데이터...

CIO 데이터스택스 DSE 운영 데이터베이스 클라우드용 데이터베이스 관계형 데이터베이스 분석 카산드라 NoSQL RDBMS 아파치 데이터베이스 가트너 빅데이터 DataStax

2016.04.18

데이터스택스가 다양한 데이터 모델을 위해 키 값부터 태뷸러, 제이슨(JSON), 그래프까지 운영 데이터베이스 지원을 강화하고 있으며, 자사 제품군에 데이터스택스 엔터프라이즈 그래프를 추가했다. 아파치 카산드라와 아파치 팅커팝의 오픈소스재단에 구축된 클라우드 애플리케이션용 데이터베이스 소프트웨어 전문업체인 데이터스택스(DataStax)는 데이터 문제에 대한 포인트 솔루션의 시대가 지나갔다는 주장을 내놨다. 미국 캘리포니아 산타클라라에 있는 신생벤처인 데이터스택스의 엔지니어링 담당 수석 부사장 마틴 반 라이스윅은 “대신 운영 DBMS의 미래는 다양한 데이터 모델을 지원하는 것”이라고 밝혔다. 그는 “아주 놀라운 새 기술로 사람들은 이전까지 해결하지 못했던 문제들을 해결하기 위해 처음에는 포인트 솔루션을 사용하려 한다. 하지만 시간이 지나면 통합 제품군을 원한다”며 “현재 우리가 보는 추세는 진정세에 가깝다. 사람들은 수많은 문제 공간을 보완할 수 있는 플랫폼을 원한다”고 말했다. 가트너 애널리스트 닉 휴데커, 머브 애드리안, 에티샴 자이디도 반 라이스윅과 비슷한 의견을 이미 내놓은 바 있다. 이들 셋은 작년 8월에 발표한 ‘NoSQL DBMS의 시장 가이드’에서 “DBMS 아키텍처와 배치의 미래는 멀티 모델이 될 것이다”고 적었다. 또 가트너 세 애널리스트들은 “2017년까지 모든 선도적 운영 DBMS가 멀티 데이터 모델, 관계형 DBMS, NoSQL을 단일 플랫폼에서 제공할 것”이라고 덧붙였다. --------------------------------------------------------------- 클라우드용 데이터베이스 ->벤더 기고 | 하이브리드 클라우드에 맞는 데이터베이스란? 따져봐야 할 3가지 -> '빅데이터와 궁합 잘 맞는' 최신 데이터...

2016.04.18

안이한 접근은 금물! NoSQL DB 도입 팁 10가지

NoSQL 데이터베이스는 오늘날 많은 애플리케이션을 지원함에 있어 민첩성과 확장성, 성능, 가용성을 구현한다. 그러나 도입이 쉽지는 않다. 오히려 각종 난관이 도사리고 있다. 여기 NoSQL 시스템을 기업에 접목시키는데 유용한 10가지 팁을 소개한다. 데이터는 기업의 혁신과 성장을 유도할 수 있다. 그러나 전제가 있다. 데이터를 효과적으로 처리할 수 있는 준비가 되어 있는 기업에만 해당된다. 오늘날 관계형 데이터베이스는 여전히 유효하지만, 경우에 따라 적합하지 않을 수 있다. 데이터 복잡성, 규모 등의 이유 때문이다. 많은 경우에 NoSQL 기술이 이런 공백을 메우게 된다. 하지만 조직에 NoSQL 시스템을 도입하는 것이 쉽지 않을 수 있다. 마크로직(MarkLogic)의 제품 부사장 조 파스콰는 노력의 대가는 충분하지만 신중한 계획과 조직의 지원이 필요하다며 많은 조직들이 이런 중요한 부분을 간과하고 있다고 지적했다. 마크로직의 NoSQL 데이터베이스는 미국의 ‘Healthcare.gov’에 적용된 바 있다. 파스콰는 기업과 NoSQL 기술을 매끄럽게 통합하는 것과 관련해 다음과 같은 10가지 요령을 공유했다. 1. 사용 사례를 개발한다 “성공적인 NoSQL 프로젝트를 위한 첫 단계는 비밀을 없애는 것이다.” 파스콰는 이렇게 말하며 자신이 달성하고자 하는 것을 명확히 이해하고 탄탄한 사용 사례를 개발해야 한다고 말했다. 그는 "이런 자세가 없는 기업은 실패할 가능성이 높다. 빅데이터 영역에서 이런 모습이 자주 보인다. 우리는 하둡(Hadoop)이 필요하고 하둡을 도입해야 한다고 말하는 사람들을 많이 만났다. 그들은 무엇을 왜 달성하려는지 모르고 있지만 하여튼 하둡이 필요하다고 주장하곤 한다. 어지간한 행운 없이는 결코 성공할 수 없는 태도다. 이러한 자세는 종종 비즈니스 가치를 이해하는데 방해가 되기도 한다." NoSQL은...

데이터베이스 DB RDBMS NoSQL 마크로직 DBA 관계형

2016.02.17

NoSQL 데이터베이스는 오늘날 많은 애플리케이션을 지원함에 있어 민첩성과 확장성, 성능, 가용성을 구현한다. 그러나 도입이 쉽지는 않다. 오히려 각종 난관이 도사리고 있다. 여기 NoSQL 시스템을 기업에 접목시키는데 유용한 10가지 팁을 소개한다. 데이터는 기업의 혁신과 성장을 유도할 수 있다. 그러나 전제가 있다. 데이터를 효과적으로 처리할 수 있는 준비가 되어 있는 기업에만 해당된다. 오늘날 관계형 데이터베이스는 여전히 유효하지만, 경우에 따라 적합하지 않을 수 있다. 데이터 복잡성, 규모 등의 이유 때문이다. 많은 경우에 NoSQL 기술이 이런 공백을 메우게 된다. 하지만 조직에 NoSQL 시스템을 도입하는 것이 쉽지 않을 수 있다. 마크로직(MarkLogic)의 제품 부사장 조 파스콰는 노력의 대가는 충분하지만 신중한 계획과 조직의 지원이 필요하다며 많은 조직들이 이런 중요한 부분을 간과하고 있다고 지적했다. 마크로직의 NoSQL 데이터베이스는 미국의 ‘Healthcare.gov’에 적용된 바 있다. 파스콰는 기업과 NoSQL 기술을 매끄럽게 통합하는 것과 관련해 다음과 같은 10가지 요령을 공유했다. 1. 사용 사례를 개발한다 “성공적인 NoSQL 프로젝트를 위한 첫 단계는 비밀을 없애는 것이다.” 파스콰는 이렇게 말하며 자신이 달성하고자 하는 것을 명확히 이해하고 탄탄한 사용 사례를 개발해야 한다고 말했다. 그는 "이런 자세가 없는 기업은 실패할 가능성이 높다. 빅데이터 영역에서 이런 모습이 자주 보인다. 우리는 하둡(Hadoop)이 필요하고 하둡을 도입해야 한다고 말하는 사람들을 많이 만났다. 그들은 무엇을 왜 달성하려는지 모르고 있지만 하여튼 하둡이 필요하다고 주장하곤 한다. 어지간한 행운 없이는 결코 성공할 수 없는 태도다. 이러한 자세는 종종 비즈니스 가치를 이해하는데 방해가 되기도 한다." NoSQL은...

2016.02.17

빅데이터와 잘 맞는 RDBMS '스플라이스 머신'... 이유는?

스플라이스 머신의 관계형 데이터베이스 2.0 버전이 최근 소개됐는데, 이 제품은 하둡의 확장성과 스파크의 인메모리 성능을 모두 갖췄다는 것이 특징이다. 이미지 출처 : Thinkstock 스플라이스 머신(Splice Machine)이 지난 11월 17일 자사 관계형 데이터베이스 관리 시스템(RDBMS, Rational DataBase Management System) 2.0 버전을 새로이 공개했다. 스플라이스 머신의 RDBMS 솔루션은 사용자에게 직원 재교육이나 수 년 분량의 SQL 재작성 등의 번거로움 없이도 하둡의 확장성과 스파크의 성능을 누릴 수 있도록 하는 것을 목표로 한다. 스플라이스 머신의 공동 설립자이자 CEO인 몬테 츠위벤은 “우리는 이 새 버전의 RDBMS가 데이터베이스 테크놀로지의 새로운 지평을 열었다고 평가하고 있다. 단일 데이터베이스로 복합적인 워크로드를 다루는 작업은 지금까지 매우 어려운 과정이었다. 지금까지 기업들은 한 곳의 플랫폼에서 자신들의 실시간, 공동 업무 작업을 진행한 뒤 그 모든 데이터를 ETL을 통해 별도의 플랫폼으로 이전하는 과정을 거치고서야 온전한 분석, 시각 도출 작업을 진행할 수 있었다”라고 이야기했다. 츠위벤은 “이러한 구조에서 기업들은 어제의 데이터를 이용해 의사결정을 내리게 된다. 모든 것이 실시간으로 변화하는 오늘날의 비즈니스 환경에서 이는 상당히 비효율적인 방식이다”라고 지적했다. --------------------------------------------------------------- 빅데이터와 DBMS 인기기사 -> '빅데이터와 궁합 잘 맞는' 최신 데이터베이스 11선 -> '옛 것 vs. 새 것' 빅데이터가 바꿔가는 데이터베이스 지형도 -> NoSQL, 데이터베이스 시장에 '폭풍'을 몰고 오다 -> 기고 | MySQL의 8가지 단점 ...

CIO 스플라이스 머신 비용 압박 OLAP OLTP 관계형 데이터베이스 클라우데라 RDBMS 하둡 비정형 데이터 ETL 성능 인메모리 빅데이터 Splice Machine

2015.11.30

스플라이스 머신의 관계형 데이터베이스 2.0 버전이 최근 소개됐는데, 이 제품은 하둡의 확장성과 스파크의 인메모리 성능을 모두 갖췄다는 것이 특징이다. 이미지 출처 : Thinkstock 스플라이스 머신(Splice Machine)이 지난 11월 17일 자사 관계형 데이터베이스 관리 시스템(RDBMS, Rational DataBase Management System) 2.0 버전을 새로이 공개했다. 스플라이스 머신의 RDBMS 솔루션은 사용자에게 직원 재교육이나 수 년 분량의 SQL 재작성 등의 번거로움 없이도 하둡의 확장성과 스파크의 성능을 누릴 수 있도록 하는 것을 목표로 한다. 스플라이스 머신의 공동 설립자이자 CEO인 몬테 츠위벤은 “우리는 이 새 버전의 RDBMS가 데이터베이스 테크놀로지의 새로운 지평을 열었다고 평가하고 있다. 단일 데이터베이스로 복합적인 워크로드를 다루는 작업은 지금까지 매우 어려운 과정이었다. 지금까지 기업들은 한 곳의 플랫폼에서 자신들의 실시간, 공동 업무 작업을 진행한 뒤 그 모든 데이터를 ETL을 통해 별도의 플랫폼으로 이전하는 과정을 거치고서야 온전한 분석, 시각 도출 작업을 진행할 수 있었다”라고 이야기했다. 츠위벤은 “이러한 구조에서 기업들은 어제의 데이터를 이용해 의사결정을 내리게 된다. 모든 것이 실시간으로 변화하는 오늘날의 비즈니스 환경에서 이는 상당히 비효율적인 방식이다”라고 지적했다. --------------------------------------------------------------- 빅데이터와 DBMS 인기기사 -> '빅데이터와 궁합 잘 맞는' 최신 데이터베이스 11선 -> '옛 것 vs. 새 것' 빅데이터가 바꿔가는 데이터베이스 지형도 -> NoSQL, 데이터베이스 시장에 '폭풍'을 몰고 오다 -> 기고 | MySQL의 8가지 단점 ...

2015.11.30

'옛 것 vs. 새 것' 빅데이터가 바꿔가는 데이터베이스 지형도

‘데이터베이스’란 말에 대부분의 사람들은 30년 이상 이 세계를 지배한 RDBMS를 떠올릴 것이다. 하지만 이러한 이런 시기는 조만간 막을 내릴 전망이다. 오늘날 여러 새로운 도전자들이 이 핵심 기업 시장을 두고 경쟁을 벌이고 있다. 이들은 다양한 방식으로 이 시장에 접근하고 있지만 대부분 빅데이터를 노리고 있다는 점에서 유사하다. 이들 새로운 대안들이 확산되는 배경에는 빅데이터의 근본에 있는 ‘3V’(Volume, Velocity, Variety) 속성이 있다. 기본적으로 오늘날의 데이터는 그 어느 때보다도 많은 양이 더욱 빠르게 생성되고 있으며 더욱 다양하기도 하다. 다시 말해, 이것은 새로운 데이터 세계다. 하지만 전통적인 관계형 데이터베이스 관리 시스템은 이런 상황에 맞춰 개발되지 않았다. 분석 및 데이터 공학 컨설팅 기업 KD너겟(KDnuggets)의 사장 그레고리 피아테스키 샤피로는 "RDBMS는 태생적으로 용량이 크고 빠르며 다양한 데이터에 맞추어 확장할 수 없는 한계를 지니고 있다"라고 말했다. 하테 행크스(Harte Hanks)가 최근 이를 실감한 기업이다. 2013년경까지 이 마케팅 서비스 기업은 마이크로소프트 SQL 서버(Microsoft SQL Server)와 오라클 RAC(Oracle Real Application Clusters) 등의 여러 데이터베이스 조합을 사용하고 있었다. 하테 행크스의 기술 및 개발 책임자 신 아아누찌는 "시간이 지남에 따라 데이터가 증가하면서 기존 시스템이 정보를 충분히 빠르게 처리하지 못한다는 사실을 깨달았다. 서버를 계속 구매한다고 해결될 문제가 아니었다. 우리는 외적으로 확장할 수 있는 플랫폼이 필요했다"라고 말했다. 이아누찌는 이어 장애를 최소화하는 것이 핵심 과제였기에 단순하게 하둡(Hadoop)으로 전향할 수는 없었다고 덧붙였다. 이 기업이 선택한 대안은, 하...

빅데이터 RDBMS NoSQL 몽고DB 관계형 데이터베이스 마크로직 NewSQL DeepSQL

2015.11.12

‘데이터베이스’란 말에 대부분의 사람들은 30년 이상 이 세계를 지배한 RDBMS를 떠올릴 것이다. 하지만 이러한 이런 시기는 조만간 막을 내릴 전망이다. 오늘날 여러 새로운 도전자들이 이 핵심 기업 시장을 두고 경쟁을 벌이고 있다. 이들은 다양한 방식으로 이 시장에 접근하고 있지만 대부분 빅데이터를 노리고 있다는 점에서 유사하다. 이들 새로운 대안들이 확산되는 배경에는 빅데이터의 근본에 있는 ‘3V’(Volume, Velocity, Variety) 속성이 있다. 기본적으로 오늘날의 데이터는 그 어느 때보다도 많은 양이 더욱 빠르게 생성되고 있으며 더욱 다양하기도 하다. 다시 말해, 이것은 새로운 데이터 세계다. 하지만 전통적인 관계형 데이터베이스 관리 시스템은 이런 상황에 맞춰 개발되지 않았다. 분석 및 데이터 공학 컨설팅 기업 KD너겟(KDnuggets)의 사장 그레고리 피아테스키 샤피로는 "RDBMS는 태생적으로 용량이 크고 빠르며 다양한 데이터에 맞추어 확장할 수 없는 한계를 지니고 있다"라고 말했다. 하테 행크스(Harte Hanks)가 최근 이를 실감한 기업이다. 2013년경까지 이 마케팅 서비스 기업은 마이크로소프트 SQL 서버(Microsoft SQL Server)와 오라클 RAC(Oracle Real Application Clusters) 등의 여러 데이터베이스 조합을 사용하고 있었다. 하테 행크스의 기술 및 개발 책임자 신 아아누찌는 "시간이 지남에 따라 데이터가 증가하면서 기존 시스템이 정보를 충분히 빠르게 처리하지 못한다는 사실을 깨달았다. 서버를 계속 구매한다고 해결될 문제가 아니었다. 우리는 외적으로 확장할 수 있는 플랫폼이 필요했다"라고 말했다. 이아누찌는 이어 장애를 최소화하는 것이 핵심 과제였기에 단순하게 하둡(Hadoop)으로 전향할 수는 없었다고 덧붙였다. 이 기업이 선택한 대안은, 하...

2015.11.12

빅데이터로 인한 변화, "생각보다 많지 않다"

최근 발표된 한 설문조사에 따르면 최근 데이터 기술이 급속도로 빨리 진화함에도 불구하고 기업 데이터의 75%는 여전히 정형화된 구조를 유지하고 있다. 여전히 관계형 데이터베이스(RDBMS)가 지배하는 세계지만 하둡과 NoSQL이 정형 데이터의 성벽을 조금씩 무너뜨리기 시작했다. 델 소프트웨어가 후원한 유니스피어(Unisphere) 설문 결과를 요약하자면 다음과 같다. 대부분의 기업에서 데이터의 75%는 여전히 RDBMS, 구체적으로 오라클과 마이크로소프트 SQL 서버의 지배하에 있다. 더 놀라운 사실은 기업의 1/3 정도가 아직 비정형 데이터를 적극적으로 관리하지 않고 있다는 점이다. 이들은 몇 세기에 살고 있는 걸까? 이번 설문에서는 NoSQL과 하둡의 도입이 증가세인 것으로 나타났지만, 사실 이 설문에서 가장 의미있는 결과는 기업의 핵심 데이터가 어떻게 관리되는지 가장 늦게 인지하는 사람은 다름아닌 보수적인 DBA(DataBase Administration)라는 것이다. 정형 데이터에 대한 정형적 접근 방법 관계형 데이터베이스는 위대한 기술 혁신 가운데 하나다. IMS와 같은 초기 데이터베이스에서 개발자는 쿼리 설계와 스키마 설계를 선행해 생각할 수밖에 없었고 따라서 데이터 변화에 따른 유연성이 제한되었다. 관계형 데이터베이스의 SQL(structured query language)은 쿼리 설계를 스키마 설계로부터 분리했고, 이로써 개발자는 나중에 필요할 때 데이터를 쿼리할 수 있다는 편안한 마음으로 스키마 설계에 집중할 수 있게 됐다. 이 큰 변화를 통해 데이터베이스는 훨씬 더 높은 접근성을 갖고 더 강력해졌다. 그러나 편리하게 정형화된 RDBMS 세계에 대한 비정형 또는 반정형 데이터의 도전이 최근 들어 잦아지고 있다. 지난 수십 년 동안 시스템 오브 레코드(system of record), 예를 들어 ERP와 CRM 시스템이 시장을 주도했음에도 불구하고 새로운 데이터의 대부분은 제프리 무어의 표현을 빌자면 &#...

빅데이터 RDBMS SQL NoSQL

2015.05.07

최근 발표된 한 설문조사에 따르면 최근 데이터 기술이 급속도로 빨리 진화함에도 불구하고 기업 데이터의 75%는 여전히 정형화된 구조를 유지하고 있다. 여전히 관계형 데이터베이스(RDBMS)가 지배하는 세계지만 하둡과 NoSQL이 정형 데이터의 성벽을 조금씩 무너뜨리기 시작했다. 델 소프트웨어가 후원한 유니스피어(Unisphere) 설문 결과를 요약하자면 다음과 같다. 대부분의 기업에서 데이터의 75%는 여전히 RDBMS, 구체적으로 오라클과 마이크로소프트 SQL 서버의 지배하에 있다. 더 놀라운 사실은 기업의 1/3 정도가 아직 비정형 데이터를 적극적으로 관리하지 않고 있다는 점이다. 이들은 몇 세기에 살고 있는 걸까? 이번 설문에서는 NoSQL과 하둡의 도입이 증가세인 것으로 나타났지만, 사실 이 설문에서 가장 의미있는 결과는 기업의 핵심 데이터가 어떻게 관리되는지 가장 늦게 인지하는 사람은 다름아닌 보수적인 DBA(DataBase Administration)라는 것이다. 정형 데이터에 대한 정형적 접근 방법 관계형 데이터베이스는 위대한 기술 혁신 가운데 하나다. IMS와 같은 초기 데이터베이스에서 개발자는 쿼리 설계와 스키마 설계를 선행해 생각할 수밖에 없었고 따라서 데이터 변화에 따른 유연성이 제한되었다. 관계형 데이터베이스의 SQL(structured query language)은 쿼리 설계를 스키마 설계로부터 분리했고, 이로써 개발자는 나중에 필요할 때 데이터를 쿼리할 수 있다는 편안한 마음으로 스키마 설계에 집중할 수 있게 됐다. 이 큰 변화를 통해 데이터베이스는 훨씬 더 높은 접근성을 갖고 더 강력해졌다. 그러나 편리하게 정형화된 RDBMS 세계에 대한 비정형 또는 반정형 데이터의 도전이 최근 들어 잦아지고 있다. 지난 수십 년 동안 시스템 오브 레코드(system of record), 예를 들어 ERP와 CRM 시스템이 시장을 주도했음에도 불구하고 새로운 데이터의 대부분은 제프리 무어의 표현을 빌자면 &#...

2015.05.07

기고 | 빅 데이터 길들이기

빅 데이터가 예상보다 빠르게 기업 속으로 파고들었다. 하지만 관리 솔루션들이 넘쳐나고 있어 빅 데이터를 관리하는 게 수월해 지고 있다고 빅인사이트(BigInsights)의 리서치 담당 이사 샤움 라힘은 전했다. 지난 해, 빅 데이터에 대한 인식이 크게 바뀌었다. 최근까지도 빅 데이터는 IT 업체들이 자사 솔루션을 더 많이 판매하기 위해 만든 '광고문구'나 유행어라는 인식이 강했다. 흥미롭게도 빅 데이터의 탄생과 IT업체 사이에는 아무런 상관관계가 없다. 빅 데이터는 디지털 방식의 처리를 원하는 소비자들에 의해 생겨났다. 기업들은 점차 더 많은 비즈니스 기능을 온라인, 모바일 기기, 센서, 기계로 이행하면서 이런 수요를 충족시켰다. 오늘날 우리가 하는 거의 모든 일들이 디지털화되면서 전통적인 IT부문에서는 다룰 수 없었던 엄청난 양의 데이터가 생겨나고 있다. IT업체 중에서도 특히 RDBMS 업체는 시장에서 어느 정도 자리를 잡았지만, 데이터의 폭발적인 증가로 엄청난 특수를 누리고자 그 누구보다도 신속하게 움직이고 있다. 물론, 그들에게 빅 데이터는 꼭 새로운 개념은 아니었다. 많은 대기업 고객들이 이미 수백 테라바이트의 데이터를 보유하고 있었다. 시스템 대체작동이 전혀 없는 최신 데이터 웨어하우징 기능이나 이용성이 높은 백업 또는 증권 시장 거래소보다 더욱 다양한 옵션 등에서 데이터 량은 전혀 문제가 되지 않았다. 일반적인 비즈니스와 크게 다르지 않았다. IT업체들이 생각하기 쉽지 않았던 부분은 속도와 다양성이라는 빅 데이터의 속성이었다. 그 어느 때보다도 다양한 종류의 데이터가 다양한 곳에서 만들어졌다. 데이터 웨어하우징은 이 문제를 해결하기에 비용 부담이 너무 컸다. 업계에서는 비용 효율적이면서도 대용량의 다양한 데이터를 신속하게 처리하고 관리할 수 있는 충분한 용량을 제공할 수 있는 무엇인가가 필요했다.   --------------------------------...

CIO IoT 사물인터넷 관계형 데이터베이스 RDBMS 하둡 비정형 데이터 빅데이터 오픈소스 더그 컷팅

2014.10.14

빅 데이터가 예상보다 빠르게 기업 속으로 파고들었다. 하지만 관리 솔루션들이 넘쳐나고 있어 빅 데이터를 관리하는 게 수월해 지고 있다고 빅인사이트(BigInsights)의 리서치 담당 이사 샤움 라힘은 전했다. 지난 해, 빅 데이터에 대한 인식이 크게 바뀌었다. 최근까지도 빅 데이터는 IT 업체들이 자사 솔루션을 더 많이 판매하기 위해 만든 '광고문구'나 유행어라는 인식이 강했다. 흥미롭게도 빅 데이터의 탄생과 IT업체 사이에는 아무런 상관관계가 없다. 빅 데이터는 디지털 방식의 처리를 원하는 소비자들에 의해 생겨났다. 기업들은 점차 더 많은 비즈니스 기능을 온라인, 모바일 기기, 센서, 기계로 이행하면서 이런 수요를 충족시켰다. 오늘날 우리가 하는 거의 모든 일들이 디지털화되면서 전통적인 IT부문에서는 다룰 수 없었던 엄청난 양의 데이터가 생겨나고 있다. IT업체 중에서도 특히 RDBMS 업체는 시장에서 어느 정도 자리를 잡았지만, 데이터의 폭발적인 증가로 엄청난 특수를 누리고자 그 누구보다도 신속하게 움직이고 있다. 물론, 그들에게 빅 데이터는 꼭 새로운 개념은 아니었다. 많은 대기업 고객들이 이미 수백 테라바이트의 데이터를 보유하고 있었다. 시스템 대체작동이 전혀 없는 최신 데이터 웨어하우징 기능이나 이용성이 높은 백업 또는 증권 시장 거래소보다 더욱 다양한 옵션 등에서 데이터 량은 전혀 문제가 되지 않았다. 일반적인 비즈니스와 크게 다르지 않았다. IT업체들이 생각하기 쉽지 않았던 부분은 속도와 다양성이라는 빅 데이터의 속성이었다. 그 어느 때보다도 다양한 종류의 데이터가 다양한 곳에서 만들어졌다. 데이터 웨어하우징은 이 문제를 해결하기에 비용 부담이 너무 컸다. 업계에서는 비용 효율적이면서도 대용량의 다양한 데이터를 신속하게 처리하고 관리할 수 있는 충분한 용량을 제공할 수 있는 무엇인가가 필요했다.   --------------------------------...

2014.10.14

페이스북·구글·트위터·링크드인, 오픈소스 MySQL 프로젝트 참여

페이스북, 구글, 링크드인, 트위터의 엔지니어링팀이 웹에서 MySQL을 실행하는 문제를 해결하기 위해 공동으로 나서 오픈소스 프로젝트인 ‘웹스케일SQL(WebScaleSQL)’ 작업을 시작한다고 밝혔다. 페이스북의 소프트웨어 엔지니어 스테판 그린은 "페이스북을 사용하는 12억 3,000만 명에게 신뢰할 수 있는 개인화된 경험을 제공하기 위해 광대한 대규모 인프라가 필요하다"며 먼저 말을 꺼냈다. "페이스북이 성장하면서 MySQL을 도입하게 됐고 이는 현재 세계에서 가장 큰 규모 중 하나가 됐다. 그러면서 MySQL 커뮤니티가 만든 코드 변경에서 배우고 혜택을 얻었다"라고 그는 설명을 이어나갔다. 이 혜택에 대한 대가를 지불하고 대규모로 MySQL을 운영하는 다른 조직을 돕고자 4개 회사의 엔지니어링팀은 오픈소스를 통해 각자가 기여해 사용할 수 있도록 업스트림 MySQL에 대한 변경 사항을 공유하기 시작했다. 그린은 이 협업이 MySQL 커뮤니티의 기존 노력을 확장하고, 웹스케일SQL이 현재의 MySQL 5.6을 지속적으로 추적할 것이라고 전했다. "웹스케일SQL 출시에 대한 우리의 목표는 우리에게 가장 중요한 측면의 우선 순위를 정하기 위해 MySQL 커뮤니티의 원래 회원들이 서로 좀더 긴밀하게 작업할 수 있도록 하는 것이다"라고 그린은 강조했다. "우리는 대규모 환경에서 개발에 특화된 더 많은 기능을 구축하고 추가하면서 MySQL5.6에서 이미 발견된 훌륭한 기능들을 기업들이 활용하도록 돕는 지식 공유 통합 시스템을 만들고자 한다"라고 그는 덧붙였다. 그린은 웹스케일SQL에 기여하는 사람들이 이미 다음과 같은 몇 가지 결과를 만들어 냈다고 밝혔다. •각각 제안된 변경을 위해 MySQL에 장착된 테스트 시스템(mtr)을 배포하고 실행할 자동화 프레임워크 •스트레스 테스트와 성능 테스트 시스템을 자동화한 프로토타입의 새로...

오픈소스 페이스북 트위터 MySQL RDBMS 관계형 데이터베이스 링크드인 웹스케일SQL

2014.03.28

페이스북, 구글, 링크드인, 트위터의 엔지니어링팀이 웹에서 MySQL을 실행하는 문제를 해결하기 위해 공동으로 나서 오픈소스 프로젝트인 ‘웹스케일SQL(WebScaleSQL)’ 작업을 시작한다고 밝혔다. 페이스북의 소프트웨어 엔지니어 스테판 그린은 "페이스북을 사용하는 12억 3,000만 명에게 신뢰할 수 있는 개인화된 경험을 제공하기 위해 광대한 대규모 인프라가 필요하다"며 먼저 말을 꺼냈다. "페이스북이 성장하면서 MySQL을 도입하게 됐고 이는 현재 세계에서 가장 큰 규모 중 하나가 됐다. 그러면서 MySQL 커뮤니티가 만든 코드 변경에서 배우고 혜택을 얻었다"라고 그는 설명을 이어나갔다. 이 혜택에 대한 대가를 지불하고 대규모로 MySQL을 운영하는 다른 조직을 돕고자 4개 회사의 엔지니어링팀은 오픈소스를 통해 각자가 기여해 사용할 수 있도록 업스트림 MySQL에 대한 변경 사항을 공유하기 시작했다. 그린은 이 협업이 MySQL 커뮤니티의 기존 노력을 확장하고, 웹스케일SQL이 현재의 MySQL 5.6을 지속적으로 추적할 것이라고 전했다. "웹스케일SQL 출시에 대한 우리의 목표는 우리에게 가장 중요한 측면의 우선 순위를 정하기 위해 MySQL 커뮤니티의 원래 회원들이 서로 좀더 긴밀하게 작업할 수 있도록 하는 것이다"라고 그린은 강조했다. "우리는 대규모 환경에서 개발에 특화된 더 많은 기능을 구축하고 추가하면서 MySQL5.6에서 이미 발견된 훌륭한 기능들을 기업들이 활용하도록 돕는 지식 공유 통합 시스템을 만들고자 한다"라고 그는 덧붙였다. 그린은 웹스케일SQL에 기여하는 사람들이 이미 다음과 같은 몇 가지 결과를 만들어 냈다고 밝혔다. •각각 제안된 변경을 위해 MySQL에 장착된 테스트 시스템(mtr)을 배포하고 실행할 자동화 프레임워크 •스트레스 테스트와 성능 테스트 시스템을 자동화한 프로토타입의 새로...

2014.03.28

글로벌 칼럼 | 오라클 RDBMS로는 안되는 10가지 작업

필자는 NoSQL 쪽을 맡고 있고 빅 데이터 전문가이기도 하다. 당신도 들어봤겠지만 현재와 같이 데이터 성장세가 뚜렷한 상황에서 이 둘은 완벽한 조합이다. 물론 오래된 습관을 없애기는 쉽지 않다. 관계형 DBMS는 여전히 시장 지배자다. 하지만 당신이 골수 오라클 팬이고 구식 RAC용 PL/SQL을 즐기고 있다면 다음 작업들을 수행하는데 있어서 당신이 사랑하는 기술을 사용하기 전에 다시 한 번 아니 여러 번 생각해보라.   1. 검색 가장 오라클을 잘 활용한다는 기업들도 오라클 데이터베이스 확장 기능인 오라클 텍스트(Oracle Text)를 사용하지 않고 있고 활발히 개발하는 것도 아니다. 대신 대부분 수작업으로 처리해야 하는 복잡한 쿼리를 사용한다. 그 결과는 긍정적이지 못하고 기능성도 떨어진다. 오라클이 필요로하는 방식으로 데이터를 얻는 절차도 쉽지 않다. 그나마 오라클을 제외한 다른 많은 RDBMS 제품들은 진정한 의미의 검색 확장기능 조차도 없다.   대안은 동면 검색(Hibernate Search), 아파치 솔(Apache Solr), 혹은 오토노미(Autonomy) 등을 사용하는 것이다. 이들은 인덱스와 풀 텍스트 검색 등에 더 적합하다.   2. 추천 오라클 ATG 웹 커머스(ATG Commerce)의 '추천'(Recommendations) 기능은 필자가 그동안 다뤄본 커머스 제품들 중 최악이다. 이들은 추천 기능을 구현하기 위해 이용자로부터 막대한 데이터를 수집한다. 필자가 작업했을 때는 확장성 때문에 추천 능력을 거의 항상 꺼두었다.   예를 들어 소셜 네트워크에서 당신의 친구나 그 친구의 친구가 양말을 샀고 필자가 그 양말을 당신에게 추천하고 싶은 경우 RDBMS에서 이를 구현하는 것은 아주 골치 아프다. 이것은 자체 결합된 테이블과 다단계 쿼리에 대한 것으로 마치 네오4j(Neo4j)같은 그래프 데이터베이스 내의 코드 두줄과...

오라클 RDBMS NoSQL

2012.11.19

필자는 NoSQL 쪽을 맡고 있고 빅 데이터 전문가이기도 하다. 당신도 들어봤겠지만 현재와 같이 데이터 성장세가 뚜렷한 상황에서 이 둘은 완벽한 조합이다. 물론 오래된 습관을 없애기는 쉽지 않다. 관계형 DBMS는 여전히 시장 지배자다. 하지만 당신이 골수 오라클 팬이고 구식 RAC용 PL/SQL을 즐기고 있다면 다음 작업들을 수행하는데 있어서 당신이 사랑하는 기술을 사용하기 전에 다시 한 번 아니 여러 번 생각해보라.   1. 검색 가장 오라클을 잘 활용한다는 기업들도 오라클 데이터베이스 확장 기능인 오라클 텍스트(Oracle Text)를 사용하지 않고 있고 활발히 개발하는 것도 아니다. 대신 대부분 수작업으로 처리해야 하는 복잡한 쿼리를 사용한다. 그 결과는 긍정적이지 못하고 기능성도 떨어진다. 오라클이 필요로하는 방식으로 데이터를 얻는 절차도 쉽지 않다. 그나마 오라클을 제외한 다른 많은 RDBMS 제품들은 진정한 의미의 검색 확장기능 조차도 없다.   대안은 동면 검색(Hibernate Search), 아파치 솔(Apache Solr), 혹은 오토노미(Autonomy) 등을 사용하는 것이다. 이들은 인덱스와 풀 텍스트 검색 등에 더 적합하다.   2. 추천 오라클 ATG 웹 커머스(ATG Commerce)의 '추천'(Recommendations) 기능은 필자가 그동안 다뤄본 커머스 제품들 중 최악이다. 이들은 추천 기능을 구현하기 위해 이용자로부터 막대한 데이터를 수집한다. 필자가 작업했을 때는 확장성 때문에 추천 능력을 거의 항상 꺼두었다.   예를 들어 소셜 네트워크에서 당신의 친구나 그 친구의 친구가 양말을 샀고 필자가 그 양말을 당신에게 추천하고 싶은 경우 RDBMS에서 이를 구현하는 것은 아주 골치 아프다. 이것은 자체 결합된 테이블과 다단계 쿼리에 대한 것으로 마치 네오4j(Neo4j)같은 그래프 데이터베이스 내의 코드 두줄과...

2012.11.19

클라우드를 가능케 한 10가지 오픈소스 프로젝트

최근 가트너와 제노스(Zenoss)가 부정적인 보고서를 내면서 오픈소스 클라우드를 깎아내리는 분위기가 확산되고 있는 것 같다. 그러나 여러 오픈 소스 기술들의 시장 점유율이 기대 이하라고 해도 오픈 소스가 없었다면 애초에 클라우드 자체가 존립하기 어려웠다. 여기 클라우드를 가능케 했던 기반 기술에 대한 10가지 오픈 소스 프로젝트를 모았다. editor@idg.co.kr

오픈소스 리눅스 DBMS 하둡 RDBMS

2012.10.29

최근 가트너와 제노스(Zenoss)가 부정적인 보고서를 내면서 오픈소스 클라우드를 깎아내리는 분위기가 확산되고 있는 것 같다. 그러나 여러 오픈 소스 기술들의 시장 점유율이 기대 이하라고 해도 오픈 소스가 없었다면 애초에 클라우드 자체가 존립하기 어려웠다. 여기 클라우드를 가능케 했던 기반 기술에 대한 10가지 오픈 소스 프로젝트를 모았다. editor@idg.co.kr

2012.10.29

“하둡과 통합된다고? 정말?”··· BI업체에 따져볼 질문들

빅 데이터가 뜨면서 빅 데이터의 핵심 기술 중 하나인 하둡에 대해 BI업체들이 경쟁하듯 지원 제품을 내놓고 있다. 포레스터 애널리스트는 이들 중에서 정말 하둡과 통합되는지를 따져보려면 BI업체체들에 몇 가지 질문을 던져보라고 조언했다. BI업체가 하둡과 완벽하게 통합되는 제품이라고 소개하면, 기업들은 BI업체들에게 꼼꼼하게 따져봐야 할 질문들이 많다고 포레스터의 한 애널리스트가 주장하고 있다. 포레스터의 애널리스트 보리스 에벨슨은 회사 블로그에서 “정확히 빅 데이터 지원이 무엇을 의미하는지 설명하지 않은 채 하둡이 이슈가 되니까 BI업체들이 빅 데이터를 지원한다고 발표하고 있다”라고 꼬집었다. 에벨슨은 IT관리자가 하둡 통합에 대한 BI업체들의 주장을 그대로 받아들이기 전에 이들 업체들에 구체적인 설명을 요구해야 한다고 주장했다. "하둡은 그리 단순한 기술이 아니다. 데이터 접근, 데이터 통합, DBMS, 시스템 관리, 보고, 분석, 데이터 탐색 등과 같은 하둡 생태계 내에서 특정 틈새 분야에 각각 대응하는 다양한 프로젝트의 집합체다”라고 그는 밝혔다. 기업들은 이러한 특성을 인식하고 하둡과 BI를 통합했다는 주장을 평가할 때 어떤 질문을 해야 할 지를 알아야 한다고 에벨슨은 말했다. 에벨슨은 컴퓨터월드와의 이메일에서 "기업이 정당한 이유로 하둡과 빅 데이터를 사용하고 분석을 수행하는 BI툴을 사용하고자 한다면, 통합의 수준이 중요하다"라고 덧붙였다. 지난 2년 동안 점점 더 많은 기업들이 오픈소스와 웹에서 대규모 비정형 데이터를 저장하고 구성할 수 있는 하둡 분산 파일 시스템(HDFS)의 상용 버전을 사용하기 시작했다. CRM, ERP, 총계정 원장 시스템에서 트랜잭션 데이터뿐 아니라 트위터 등 소셜 미디어와 마이크로 블로그와 기계 센서, 웹에서 새로운 많은 데이터를 취합하기 시작했다. 새로운 대규모 비정형 데이터는 하둡 시스템에서 분석됐는데, 이는 하둡 시스템이...

통합 포레스터 하둡 RDBMS 관계형 DBMS 확인 검증

2012.09.26

빅 데이터가 뜨면서 빅 데이터의 핵심 기술 중 하나인 하둡에 대해 BI업체들이 경쟁하듯 지원 제품을 내놓고 있다. 포레스터 애널리스트는 이들 중에서 정말 하둡과 통합되는지를 따져보려면 BI업체체들에 몇 가지 질문을 던져보라고 조언했다. BI업체가 하둡과 완벽하게 통합되는 제품이라고 소개하면, 기업들은 BI업체들에게 꼼꼼하게 따져봐야 할 질문들이 많다고 포레스터의 한 애널리스트가 주장하고 있다. 포레스터의 애널리스트 보리스 에벨슨은 회사 블로그에서 “정확히 빅 데이터 지원이 무엇을 의미하는지 설명하지 않은 채 하둡이 이슈가 되니까 BI업체들이 빅 데이터를 지원한다고 발표하고 있다”라고 꼬집었다. 에벨슨은 IT관리자가 하둡 통합에 대한 BI업체들의 주장을 그대로 받아들이기 전에 이들 업체들에 구체적인 설명을 요구해야 한다고 주장했다. "하둡은 그리 단순한 기술이 아니다. 데이터 접근, 데이터 통합, DBMS, 시스템 관리, 보고, 분석, 데이터 탐색 등과 같은 하둡 생태계 내에서 특정 틈새 분야에 각각 대응하는 다양한 프로젝트의 집합체다”라고 그는 밝혔다. 기업들은 이러한 특성을 인식하고 하둡과 BI를 통합했다는 주장을 평가할 때 어떤 질문을 해야 할 지를 알아야 한다고 에벨슨은 말했다. 에벨슨은 컴퓨터월드와의 이메일에서 "기업이 정당한 이유로 하둡과 빅 데이터를 사용하고 분석을 수행하는 BI툴을 사용하고자 한다면, 통합의 수준이 중요하다"라고 덧붙였다. 지난 2년 동안 점점 더 많은 기업들이 오픈소스와 웹에서 대규모 비정형 데이터를 저장하고 구성할 수 있는 하둡 분산 파일 시스템(HDFS)의 상용 버전을 사용하기 시작했다. CRM, ERP, 총계정 원장 시스템에서 트랜잭션 데이터뿐 아니라 트위터 등 소셜 미디어와 마이크로 블로그와 기계 센서, 웹에서 새로운 많은 데이터를 취합하기 시작했다. 새로운 대규모 비정형 데이터는 하둡 시스템에서 분석됐는데, 이는 하둡 시스템이...

2012.09.26

기고 | 빅 데이터 시대, 어떤 DBMS를 골라야 할까

빅 데이터 시대에서 관계형 DBMS는 더 이상 많은 데이터베이스 업무용으로 적합하지 않다. NoSQL 대안 제품들 중 무엇을 선택해야 할 지를 참고할 만한 기준을 소개하고자 한다. 필자는 지난 몇 주간 시카고에서 필자 회사의 지사를 설립하는 일에 전념했다. 실리콘밸리가 빅 데이터 업체들의 집결지라면, 시카고는 빅 데이터 사용자와 종사자들의 집결지라 할 수 있다. 그래서 이곳의 많은 사람들은 거의 매일 빽빽한 미팅과 빅 데이터 행사에 참석하는 일에도 어느정도 익숙한 편이다. 거의 대부분의 빅 데이터 행사들에서 NoSQL에 대한 소개와, 우리가 더 이상 모든 것을 RDBMS에 담을 수 없는 이유를 들을 수 있다. 당장 많은 청중들에게는 생소한 이야기다. 몇 가지 NoSQL 데이터베이스가 존재하고, 각기 다른 데이터세트를 위한 각각의 데이터세트를 사용해야할 타당한 이유도 존재한다. 이건 “NoSQL=규모(scale)”라는 IT업계의 마케팅보다 훨씬 얽히고 설킨 문제다. --------------------------------------------------------------- NoSQL 인기기사 ->NoSQL 표준의 시대가 왔다 -> ʺ새로운 SQL이 뜬다ʺ SQL과 NoSQL의 장점 결합한 NewSQL ->하둡으로 가는 길 | 제1부 기술과 훈련 -> 주목! 9가지 오픈소스 빅 데이터 기술 -> 주목해야 할 오픈소스 프로그래밍 툴 11선 ---------------------------------------------------------------   그렇게 많은 종류의 NoSQL 데이터베이스가 존재하는 이유로 브루어의 정리(Brewer’s Theorem)로 알려진 CAP정리를 들 수 있다. CAP정리는, 지속성(consistency), 가용성(availability), 파티션 수용성(partition tolerance)이라는 세 가지 ...

맵리듀스 RDBMS NoSQL 카산드라 관계형 데이테베이스

2012.08.20

빅 데이터 시대에서 관계형 DBMS는 더 이상 많은 데이터베이스 업무용으로 적합하지 않다. NoSQL 대안 제품들 중 무엇을 선택해야 할 지를 참고할 만한 기준을 소개하고자 한다. 필자는 지난 몇 주간 시카고에서 필자 회사의 지사를 설립하는 일에 전념했다. 실리콘밸리가 빅 데이터 업체들의 집결지라면, 시카고는 빅 데이터 사용자와 종사자들의 집결지라 할 수 있다. 그래서 이곳의 많은 사람들은 거의 매일 빽빽한 미팅과 빅 데이터 행사에 참석하는 일에도 어느정도 익숙한 편이다. 거의 대부분의 빅 데이터 행사들에서 NoSQL에 대한 소개와, 우리가 더 이상 모든 것을 RDBMS에 담을 수 없는 이유를 들을 수 있다. 당장 많은 청중들에게는 생소한 이야기다. 몇 가지 NoSQL 데이터베이스가 존재하고, 각기 다른 데이터세트를 위한 각각의 데이터세트를 사용해야할 타당한 이유도 존재한다. 이건 “NoSQL=규모(scale)”라는 IT업계의 마케팅보다 훨씬 얽히고 설킨 문제다. --------------------------------------------------------------- NoSQL 인기기사 ->NoSQL 표준의 시대가 왔다 -> ʺ새로운 SQL이 뜬다ʺ SQL과 NoSQL의 장점 결합한 NewSQL ->하둡으로 가는 길 | 제1부 기술과 훈련 -> 주목! 9가지 오픈소스 빅 데이터 기술 -> 주목해야 할 오픈소스 프로그래밍 툴 11선 ---------------------------------------------------------------   그렇게 많은 종류의 NoSQL 데이터베이스가 존재하는 이유로 브루어의 정리(Brewer’s Theorem)로 알려진 CAP정리를 들 수 있다. CAP정리는, 지속성(consistency), 가용성(availability), 파티션 수용성(partition tolerance)이라는 세 가지 ...

2012.08.20

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.13