Offcanvas

������������SQL

'내부 머신러닝 지원' 데이터베이스 8종

2020년 8월 기사인 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’How to choose a cloud machine learning platform)’에서 플랫폼을 선택하는 첫째 기준으로서 ‘데이터와 가까울 것’e close to your data)를 제안했던 바 있다. 코드(소프트웨어)를 데이터에 가까이 유지하는 것은 지연을 낮게 유지하는 데 필수적이다. 전송 속도가 빛의 속도로 제한되기 때문이다. 결국, 머신러닝, 특히 딥러닝은 각종 데이터를 여러 차례 통과하는 경향이 있다(각 통과는 에포크(epoch)라고 불린다).  당시 기사에서는 대량 데이터 세트라면 데이터가 상주하는 곳에 모델이 구축되는 것이 이상적이라고 권고됐다. 그래야 대량 데이터 전송이 필요하지 않기 때문이다. 몇몇 데이터베이스는 이를 제한적인 수준에서나마 지원한다. 자연스럽게 이어지는 다음 질문은 어떤 데이터베이스가 내부 머신러닝을 지원하는지, 그리고 지원이 어떤 방식으로 이루어지는 지이다. 여기서는 이들 데이터베이스를 알파벳 순서로 논의한다.    아마존 레드시프트  아마존 레드시프트(Amazon Redshift)는 관리형 페타바이트 규모의 데이터 웨어하우스 서비스이고, 기업이 기존의 비즈니스 인텔리전스 툴을 이용해 모든 데이터를 분석할 수 있는 단순하고 비용 효율적인 해법이다. 이는 몇 백 기가바이트로부터 페타바이트 또는 그 이상에 이르는 데이터 세트에 최적화돼 있으며, 비용은 연간 테라바이트당 1,000달러 미만이다.  아마존 레드시프트 ML(Amazon Redshift ML)은 SQL 이용자가 SQL 명령을 사용해 머신러닝 모델을 생성하고 훈련하고 전개하는 것을 쉽게 할 수 있도록 설계되었다. 레드시프트 SQL의 ‘모델 생성하기(CREATE MODEL)’ 명령은 훈련에 쓰일 데이터와 표적 컬럼을 정의하고, 동일 권역 내의 암호화된 아마존 S3 버킷을 통해 데이터를 아마존 세이지메이커 오토파일럿(Amazon SageMaker A...

블레이징SQL 구글 클라우드 빅쿼리 IBM Db2 웨어하우스 키네티카 오라클 데이터베이스 마이크로소프트 SQL 서버 오라클 클라우드 인프라 데이터 사이언스 버티카 애널리틱스 플랫폼 마인즈DB

2021.05.03

2020년 8월 기사인 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’How to choose a cloud machine learning platform)’에서 플랫폼을 선택하는 첫째 기준으로서 ‘데이터와 가까울 것’e close to your data)를 제안했던 바 있다. 코드(소프트웨어)를 데이터에 가까이 유지하는 것은 지연을 낮게 유지하는 데 필수적이다. 전송 속도가 빛의 속도로 제한되기 때문이다. 결국, 머신러닝, 특히 딥러닝은 각종 데이터를 여러 차례 통과하는 경향이 있다(각 통과는 에포크(epoch)라고 불린다).  당시 기사에서는 대량 데이터 세트라면 데이터가 상주하는 곳에 모델이 구축되는 것이 이상적이라고 권고됐다. 그래야 대량 데이터 전송이 필요하지 않기 때문이다. 몇몇 데이터베이스는 이를 제한적인 수준에서나마 지원한다. 자연스럽게 이어지는 다음 질문은 어떤 데이터베이스가 내부 머신러닝을 지원하는지, 그리고 지원이 어떤 방식으로 이루어지는 지이다. 여기서는 이들 데이터베이스를 알파벳 순서로 논의한다.    아마존 레드시프트  아마존 레드시프트(Amazon Redshift)는 관리형 페타바이트 규모의 데이터 웨어하우스 서비스이고, 기업이 기존의 비즈니스 인텔리전스 툴을 이용해 모든 데이터를 분석할 수 있는 단순하고 비용 효율적인 해법이다. 이는 몇 백 기가바이트로부터 페타바이트 또는 그 이상에 이르는 데이터 세트에 최적화돼 있으며, 비용은 연간 테라바이트당 1,000달러 미만이다.  아마존 레드시프트 ML(Amazon Redshift ML)은 SQL 이용자가 SQL 명령을 사용해 머신러닝 모델을 생성하고 훈련하고 전개하는 것을 쉽게 할 수 있도록 설계되었다. 레드시프트 SQL의 ‘모델 생성하기(CREATE MODEL)’ 명령은 훈련에 쓰일 데이터와 표적 컬럼을 정의하고, 동일 권역 내의 암호화된 아마존 S3 버킷을 통해 데이터를 아마존 세이지메이커 오토파일럿(Amazon SageMaker A...

2021.05.03

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.13