Offcanvas

��������� ������������������

'내부 머신러닝 지원' 데이터베이스 8종

2020년 8월 기사인 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’How to choose a cloud machine learning platform)’에서 플랫폼을 선택하는 첫째 기준으로서 ‘데이터와 가까울 것’e close to your data)를 제안했던 바 있다. 코드(소프트웨어)를 데이터에 가까이 유지하는 것은 지연을 낮게 유지하는 데 필수적이다. 전송 속도가 빛의 속도로 제한되기 때문이다. 결국, 머신러닝, 특히 딥러닝은 각종 데이터를 여러 차례 통과하는 경향이 있다(각 통과는 에포크(epoch)라고 불린다).  당시 기사에서는 대량 데이터 세트라면 데이터가 상주하는 곳에 모델이 구축되는 것이 이상적이라고 권고됐다. 그래야 대량 데이터 전송이 필요하지 않기 때문이다. 몇몇 데이터베이스는 이를 제한적인 수준에서나마 지원한다. 자연스럽게 이어지는 다음 질문은 어떤 데이터베이스가 내부 머신러닝을 지원하는지, 그리고 지원이 어떤 방식으로 이루어지는 지이다. 여기서는 이들 데이터베이스를 알파벳 순서로 논의한다.    아마존 레드시프트  아마존 레드시프트(Amazon Redshift)는 관리형 페타바이트 규모의 데이터 웨어하우스 서비스이고, 기업이 기존의 비즈니스 인텔리전스 툴을 이용해 모든 데이터를 분석할 수 있는 단순하고 비용 효율적인 해법이다. 이는 몇 백 기가바이트로부터 페타바이트 또는 그 이상에 이르는 데이터 세트에 최적화돼 있으며, 비용은 연간 테라바이트당 1,000달러 미만이다.  아마존 레드시프트 ML(Amazon Redshift ML)은 SQL 이용자가 SQL 명령을 사용해 머신러닝 모델을 생성하고 훈련하고 전개하는 것을 쉽게 할 수 있도록 설계되었다. 레드시프트 SQL의 ‘모델 생성하기(CREATE MODEL)’ 명령은 훈련에 쓰일 데이터와 표적 컬럼을 정의하고, 동일 권역 내의 암호화된 아마존 S3 버킷을 통해 데이터를 아마존 세이지메이커 오토파일럿(Amazon SageMaker A...

블레이징SQL 구글 클라우드 빅쿼리 IBM Db2 웨어하우스 키네티카 오라클 데이터베이스 마이크로소프트 SQL 서버 오라클 클라우드 인프라 데이터 사이언스 버티카 애널리틱스 플랫폼 마인즈DB

2021.05.03

2020년 8월 기사인 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’How to choose a cloud machine learning platform)’에서 플랫폼을 선택하는 첫째 기준으로서 ‘데이터와 가까울 것’e close to your data)를 제안했던 바 있다. 코드(소프트웨어)를 데이터에 가까이 유지하는 것은 지연을 낮게 유지하는 데 필수적이다. 전송 속도가 빛의 속도로 제한되기 때문이다. 결국, 머신러닝, 특히 딥러닝은 각종 데이터를 여러 차례 통과하는 경향이 있다(각 통과는 에포크(epoch)라고 불린다).  당시 기사에서는 대량 데이터 세트라면 데이터가 상주하는 곳에 모델이 구축되는 것이 이상적이라고 권고됐다. 그래야 대량 데이터 전송이 필요하지 않기 때문이다. 몇몇 데이터베이스는 이를 제한적인 수준에서나마 지원한다. 자연스럽게 이어지는 다음 질문은 어떤 데이터베이스가 내부 머신러닝을 지원하는지, 그리고 지원이 어떤 방식으로 이루어지는 지이다. 여기서는 이들 데이터베이스를 알파벳 순서로 논의한다.    아마존 레드시프트  아마존 레드시프트(Amazon Redshift)는 관리형 페타바이트 규모의 데이터 웨어하우스 서비스이고, 기업이 기존의 비즈니스 인텔리전스 툴을 이용해 모든 데이터를 분석할 수 있는 단순하고 비용 효율적인 해법이다. 이는 몇 백 기가바이트로부터 페타바이트 또는 그 이상에 이르는 데이터 세트에 최적화돼 있으며, 비용은 연간 테라바이트당 1,000달러 미만이다.  아마존 레드시프트 ML(Amazon Redshift ML)은 SQL 이용자가 SQL 명령을 사용해 머신러닝 모델을 생성하고 훈련하고 전개하는 것을 쉽게 할 수 있도록 설계되었다. 레드시프트 SQL의 ‘모델 생성하기(CREATE MODEL)’ 명령은 훈련에 쓰일 데이터와 표적 컬럼을 정의하고, 동일 권역 내의 암호화된 아마존 S3 버킷을 통해 데이터를 아마존 세이지메이커 오토파일럿(Amazon SageMaker A...

2021.05.03

구식 데이터베이스에서 가능한 10 가지 트릭

이미 보유한 구식 오라클, SQL 서버, MySQL, 포스트그레SQL 데이터베이스에 숨겨진 ‘NoSQL’ 기능이 꽤나 강력할 수 있다. 어쩌면 꽤 놀랄지도 모른다.  NoSQL 데이터베이스, 분산 데이터베이스, 데이터 웨어하우스 및 GPU 가속화 데이터베이스에 대해 열광하고 있는가? 그러나 어쩌면 기존의 관계형 데이터베이스가 여전히 핵심적인 정보를 저장하고 제공한다는 사실을 간과할 수 있겠다.  오라클 데이터베이스, 마이크로소프트 SQL 서버, MySQL/마리아DB 및 포스트그레(Postgre)SQL은 그 시작이 1980년대까지 거슬러 올라가지만, 모두 여전히 활발하게 개발되고 있다. 단지 버그를 고치고 성능을 조정하는데 그치지 않는다. 이 기사에서는 기존의 SQL 데이터베이스가 개선되고 있는 여러 방식에 대해 살펴본다. 일부는 데이터를 사용하기 위한 색인 및 검색 기능과 함께 여러 종류의 데이터를 지원하는 것과 관련이 있다. 또 다른 것은 자주 사용하는 테이블들에 대한 엑세스 속도를 높이는 것에 초점을 맞춘다. 데이터베이스를 자신의 테이블, 단일 서버 및 SQL 쿼리를 넘어서 확장하는 것과 관련된 것들도 있다.  전문(full-text) 검색 표준적인 관계형 데이터베이스 인덱스는 성능상의 이유로 간략한 필드나 심지어 해시를 사용하는 경향이 있다. 전문 검색은 다르다. 전문 검색은 일반적으로 단어, 기록 및 오프셋 위치의 뒤집어진 목록과 같이 다른 종류의 인덱스로 다뤄진다. 종종 무시되는 제외어의 목록과 각 단어의 다른 형태를 생성하기 위한 추출 알고리즘이 있다. 일부 전문 검색 엔진은 불리안(Boolean) 작업, 퍼지 검색 또는 인접 검색을 지원한다. 오라클 데이터베이스, SQL 서버, MySQL/마리아DB 및 포스트그레SQL은 (MySQL 용어를 사용하자면) 모두 FULLTEXT 인덱스가 있는 CHAR, VARCHAR 또는 TEXT 열과 같이 특별히 지정된 텍스트 필드에 대한 전문 검색을 제공한다. 또한 엘라스틱서치...

MySQL SQL 서버 오라클 데이터베이스 포스트그레SQL 데이터베이스

2019.06.19

이미 보유한 구식 오라클, SQL 서버, MySQL, 포스트그레SQL 데이터베이스에 숨겨진 ‘NoSQL’ 기능이 꽤나 강력할 수 있다. 어쩌면 꽤 놀랄지도 모른다.  NoSQL 데이터베이스, 분산 데이터베이스, 데이터 웨어하우스 및 GPU 가속화 데이터베이스에 대해 열광하고 있는가? 그러나 어쩌면 기존의 관계형 데이터베이스가 여전히 핵심적인 정보를 저장하고 제공한다는 사실을 간과할 수 있겠다.  오라클 데이터베이스, 마이크로소프트 SQL 서버, MySQL/마리아DB 및 포스트그레(Postgre)SQL은 그 시작이 1980년대까지 거슬러 올라가지만, 모두 여전히 활발하게 개발되고 있다. 단지 버그를 고치고 성능을 조정하는데 그치지 않는다. 이 기사에서는 기존의 SQL 데이터베이스가 개선되고 있는 여러 방식에 대해 살펴본다. 일부는 데이터를 사용하기 위한 색인 및 검색 기능과 함께 여러 종류의 데이터를 지원하는 것과 관련이 있다. 또 다른 것은 자주 사용하는 테이블들에 대한 엑세스 속도를 높이는 것에 초점을 맞춘다. 데이터베이스를 자신의 테이블, 단일 서버 및 SQL 쿼리를 넘어서 확장하는 것과 관련된 것들도 있다.  전문(full-text) 검색 표준적인 관계형 데이터베이스 인덱스는 성능상의 이유로 간략한 필드나 심지어 해시를 사용하는 경향이 있다. 전문 검색은 다르다. 전문 검색은 일반적으로 단어, 기록 및 오프셋 위치의 뒤집어진 목록과 같이 다른 종류의 인덱스로 다뤄진다. 종종 무시되는 제외어의 목록과 각 단어의 다른 형태를 생성하기 위한 추출 알고리즘이 있다. 일부 전문 검색 엔진은 불리안(Boolean) 작업, 퍼지 검색 또는 인접 검색을 지원한다. 오라클 데이터베이스, SQL 서버, MySQL/마리아DB 및 포스트그레SQL은 (MySQL 용어를 사용하자면) 모두 FULLTEXT 인덱스가 있는 CHAR, VARCHAR 또는 TEXT 열과 같이 특별히 지정된 텍스트 필드에 대한 전문 검색을 제공한다. 또한 엘라스틱서치...

2019.06.19

IDG 설문조사

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.6