Offcanvas

���������ML

‘인 데이터베이스’ 머신러닝 지원하는 데이터베이스 8종

2020년 8월 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’이라는 글에서 플랫폼 선택의 첫 번째 가이드라인으로 ‘데이터에 가까이 다가가기’를 제시했다. 빛의 속도가 전송 속도를 제한하기 때문에 지연을 낮게 유지하기 위해 데이터 근처에 코드를 존재하는 것이 바람직하다. 머신러닝의 경우 모든 데이터를 여러 차례 검토하는 경향이 있다는 점을 감안하면 더욱 그렇다(각각의 검토 과정을 에포크(Epoch)라고 지칭된다). 필자는 당시 큰 데이터 세트를 데이터가 이미 위치한 장소에 모델을 구축함으로써, 대량의 데이터 전송을 불필요하게 만드는 것이 좋다고 설명했다. 몇몇 데이터베이스가 제한된 범위에서 이러한 콘셉트를 지원한다. 그렇다면 내부 머신러닝을 지원하는 데이터베이스는 무엇일까? 어떤 방법으로 이를 지원할까? 이런 데이터베이스를 알파벳 순으로 소개한다.   아마존 레드시프트 아마존 레드시프트는 기존 비즈니스 인텔리전스 도구를 이용해 데이터를 쉽게, 비용 효과적으로 분석할 수 있도록 설계된 관리형 페타바이트급 데이터 웨어하우스 서비스이다. 몇 백 기가바이트에서 1 페타바이트까지 다양한 크기의 데이터세트에 최적화되어 있고, 비용은 연간 테라바이트 당 1,000달러 미만이다. 아마존 레드시프트 머신러닝은 SQL 사용자가 SQL 명령을 사용하여 쉽게 머신러닝 모델을 만들고, 트레이닝하고, 배포할 수 있도록 설계되어 있다. 레드시프트 SQL의 CREATE MODEL 명령은 트레이닝과 대상 열에 사용할 데이터를 정의하고, 동일한 구역의 암호화된 아마존 S3 버킷을 통해 아마존 세이지메이커 오토파일럿로 보내 트레이닝을 한다. 오토ML 트레이닝 후, 레드시프트 ML은 최상의 모델을 컴파일링하고, 사용자의 레드시프트 클러스터에 예측 SQL 함수로 등록한다. 그러면 사용자는 SELECT 구문 내 예측 함수를 호출하는 방법으로 추론을 위한 모델을 호출할 수 있다. 요약 : 레드시프트 ML은 세이지메이커 오토파일럿을 사용, 자동으로 SQL 구문을 통해 지정한 데이터...

머신러닝 데이터베이스 아마존 레드시프트 블레이징 빅쿼리 빅쿼리ML SQL 오라클

2021.02.19

2020년 8월 ‘클라우드 머신러닝 플랫폼 선택 기준 12가지’이라는 글에서 플랫폼 선택의 첫 번째 가이드라인으로 ‘데이터에 가까이 다가가기’를 제시했다. 빛의 속도가 전송 속도를 제한하기 때문에 지연을 낮게 유지하기 위해 데이터 근처에 코드를 존재하는 것이 바람직하다. 머신러닝의 경우 모든 데이터를 여러 차례 검토하는 경향이 있다는 점을 감안하면 더욱 그렇다(각각의 검토 과정을 에포크(Epoch)라고 지칭된다). 필자는 당시 큰 데이터 세트를 데이터가 이미 위치한 장소에 모델을 구축함으로써, 대량의 데이터 전송을 불필요하게 만드는 것이 좋다고 설명했다. 몇몇 데이터베이스가 제한된 범위에서 이러한 콘셉트를 지원한다. 그렇다면 내부 머신러닝을 지원하는 데이터베이스는 무엇일까? 어떤 방법으로 이를 지원할까? 이런 데이터베이스를 알파벳 순으로 소개한다.   아마존 레드시프트 아마존 레드시프트는 기존 비즈니스 인텔리전스 도구를 이용해 데이터를 쉽게, 비용 효과적으로 분석할 수 있도록 설계된 관리형 페타바이트급 데이터 웨어하우스 서비스이다. 몇 백 기가바이트에서 1 페타바이트까지 다양한 크기의 데이터세트에 최적화되어 있고, 비용은 연간 테라바이트 당 1,000달러 미만이다. 아마존 레드시프트 머신러닝은 SQL 사용자가 SQL 명령을 사용하여 쉽게 머신러닝 모델을 만들고, 트레이닝하고, 배포할 수 있도록 설계되어 있다. 레드시프트 SQL의 CREATE MODEL 명령은 트레이닝과 대상 열에 사용할 데이터를 정의하고, 동일한 구역의 암호화된 아마존 S3 버킷을 통해 아마존 세이지메이커 오토파일럿로 보내 트레이닝을 한다. 오토ML 트레이닝 후, 레드시프트 ML은 최상의 모델을 컴파일링하고, 사용자의 레드시프트 클러스터에 예측 SQL 함수로 등록한다. 그러면 사용자는 SELECT 구문 내 예측 함수를 호출하는 방법으로 추론을 위한 모델을 호출할 수 있다. 요약 : 레드시프트 ML은 세이지메이커 오토파일럿을 사용, 자동으로 SQL 구문을 통해 지정한 데이터...

2021.02.19

'오픈소스, AI···' 올해 구글 클라우드 넥스트에서 소개된 9가지

지난주 구글 클라우드는 대규모 연례행사인 구글 클라우드 넥스트 2019를 성공적으로 끝마쳤고, 신임 CEO인 토마스 쿠리안은 11월 취임 이래 처음으로 공개 석상에서 프레젠테이션을 가졌다.  구글 클라우드는 자사의 비전과 보안, 협업 등 온갖 포트폴리오에 관해서도 이 행사에서 발표했다.  구글 클라우드 넥스트 2019에서 알게 된 9가지를 정리했다.   1. 쿠리안의 리더십  지난주는 많은 사람이 구글 클라우드의 신임 CEO를 대면할 최초의 기회였다. 전직 오라클 임원이었던 신임 CEO 쿠리안은 자신의 첫 번째 기조연설을 하면서 구글 클라우드의 비전을 제시할 때 동료들과 파트너에 의지하는 등 겸손한 모습을 보였다.  그는 자신의 전략에서 3가지 요소를 집중적으로 다루며 다음과 같이 말했다. “우리는 세계적 규모의 분산되고 안전한 인프라, 그리고 혁신적 디지털 변혁 솔루션을 구축할 수 있는 디지털 트랜스포메이션 플랫폼, 그리고 여러 업종의 디지털 변혁을 위해 업종별로 특화된 기능을 (고객에게) 제공하고 싶다.” 쿠리안은 디지털 트랜스포메이션 플랫폼을 다시 5개 요소로 세분했다. 그는 “대규모 데이터를 관리할 수 있고, 애플리케이션 워크로드를 구축하고 현대화할 수 있으며, 분석을 이행해 좀더 나은 비즈니스 결정을 내릴 수 있고, 구글의 AI 및 ML 기술 진보를 활용할 수 있으며, 조직 내외의 다른 사람과 심오하게 새로운 방식으로 협력할 수 있는 기능이다”고 말했다.  2. 안토스 발표  중대한 최초 발표는 고객이 온-프레미스에서, 구글 클라우드에서, 그리고 중요하게도, 마이크로소프트 애저, 아마존 웹 서비스 등 다른 대형 퍼블릭 클라우드 사업자를 통해 애플리케이션을 실행할 수 있는 플랫폼인 안토스(Anthos)다.  쿠리안은 “안토스는 고객이 클라우드 사업자로부터 원하는 3가지 중요 사항을 반영했다. 첫째, 아직 클...

CEO 빅쿼리ML 구글 클라우드 런 구글 클라우드 넥스트 2019 안토스 토마스 쿠리안 서버리스 G스위트 GCP 쿠버네티스 디지털 변혁 구글 클라우드 인공지능 데이터베이스 하이브리드 멀티 클라우드

2019.04.17

지난주 구글 클라우드는 대규모 연례행사인 구글 클라우드 넥스트 2019를 성공적으로 끝마쳤고, 신임 CEO인 토마스 쿠리안은 11월 취임 이래 처음으로 공개 석상에서 프레젠테이션을 가졌다.  구글 클라우드는 자사의 비전과 보안, 협업 등 온갖 포트폴리오에 관해서도 이 행사에서 발표했다.  구글 클라우드 넥스트 2019에서 알게 된 9가지를 정리했다.   1. 쿠리안의 리더십  지난주는 많은 사람이 구글 클라우드의 신임 CEO를 대면할 최초의 기회였다. 전직 오라클 임원이었던 신임 CEO 쿠리안은 자신의 첫 번째 기조연설을 하면서 구글 클라우드의 비전을 제시할 때 동료들과 파트너에 의지하는 등 겸손한 모습을 보였다.  그는 자신의 전략에서 3가지 요소를 집중적으로 다루며 다음과 같이 말했다. “우리는 세계적 규모의 분산되고 안전한 인프라, 그리고 혁신적 디지털 변혁 솔루션을 구축할 수 있는 디지털 트랜스포메이션 플랫폼, 그리고 여러 업종의 디지털 변혁을 위해 업종별로 특화된 기능을 (고객에게) 제공하고 싶다.” 쿠리안은 디지털 트랜스포메이션 플랫폼을 다시 5개 요소로 세분했다. 그는 “대규모 데이터를 관리할 수 있고, 애플리케이션 워크로드를 구축하고 현대화할 수 있으며, 분석을 이행해 좀더 나은 비즈니스 결정을 내릴 수 있고, 구글의 AI 및 ML 기술 진보를 활용할 수 있으며, 조직 내외의 다른 사람과 심오하게 새로운 방식으로 협력할 수 있는 기능이다”고 말했다.  2. 안토스 발표  중대한 최초 발표는 고객이 온-프레미스에서, 구글 클라우드에서, 그리고 중요하게도, 마이크로소프트 애저, 아마존 웹 서비스 등 다른 대형 퍼블릭 클라우드 사업자를 통해 애플리케이션을 실행할 수 있는 플랫폼인 안토스(Anthos)다.  쿠리안은 “안토스는 고객이 클라우드 사업자로부터 원하는 3가지 중요 사항을 반영했다. 첫째, 아직 클...

2019.04.17

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.6