Offcanvas

BI / How To / 비즈니스|경제

예측 애널리틱스 툴 8종 톺아보기

2022.05.16 Peter Wayner  |  CIO
미래를 예측하고 싶은가? 예측 애널리틱스는 답을 알고 있다. 그렇다면 이들의 답은 잘 맞는가? 간혹 맞다. 

다행히 간혹 맞기만 하더라도 기업이 계획하는 데, 지출하는 데, 앞선 서비스를 제공하는 데 도움이 될 수 있다면 충분히 유용하다.
 
Image Credit : Getty Images Bank


예측 애널리틱스 툴이란? 
예측 애널리틱스 툴은 인공지능과 비즈니스 리포트를 뒤섞는 존재라고 볼 수 있다. 이들 툴은 대개 전사적으로 데이터를 수집하기 위한 정교한 파이프라인을 내장하고 있으며, 통계 분석과 머신러닝 계층을 추가적으로 품고 있다. 이를 통해 미래를 예측하고, 인사이트를 유용하게 요약해 비즈니스 사용자가 이에 입각해 행동할 수 있게 돕는다.

예측의 질은 데이터에 크게 좌우된다. 메인프레임 시대의 오래된 표어인 ‘가비지 인, 가비지 아웃(garbage in, garbage our)’은 오늘날에도 여전히 유효하다. 다른 한계도 있다. 예측 애널리틱스는 미래가 과거와 단절되는 순간까지 마법처럼 예측할 수 없다. 그럼에도 불구하고 패턴을 확인하고 예측하는 역량은 점점 더 정교해지고 있다. 

전문 예측 애널리틱스를 활용하는 작업은, 적어도 자체적으로 프로그래밍하는 것에 비하면, 비교적 쉽다. 대다수의 툴은 시각적 프로그래밍 인터페이스를 제공하기 때문에 사용자는 데이터 분석에 최적화된 각종 아이콘을 드래그 앤 드롭 할 수 있다. 몇 번의 마우스 클릭만으로 정교한 예측을 생성할 수 있다. 더 많은 것이 필요한 경우 약간의 커스텀 코드를 추가하면 다수의 일반적인 문제들을 해결할 수 있다. 

알터릭스 애널리틱스 프로세스 오토메이션
알터릭스의 애널리틱스 프로세스 오토메이션(Analytic Process Automation ; APA) 플랫폼은 데이터를 정화하는 파이프라인을 구축하는 데 유용하며, 데이터 과학 및 머신러닝 알고리즘을 적용할 수 있도록 돕는다. 

특히 수준 높은 자동화를 갖춰 모델의 실무 투입을 촉진해주며 인사이트와 예측을 지속적으로 생성한다. 시각 IDE는 복합적인 파이프라인을 형성할 수 있는 300가지 이상의 선택지를 제공한다. APA의 한가지 강점은 지구 공간 데이터베이스(geospatial database), 인구 데이터 등 다른 데이터 소스와의 깊은 통합이다. 이를 활용해 사용자는 자체 데이터 세트의 질을 향상시킬 수 있다.

• 다수의 결과물을 생성하기 위해 복합적인 데이터 소스 컬렉션을 자동화해야 하는 데이터 과학자에게 매우 훌륭한 솔루션임
• 로컬이나 알터릭스 클라우드에서 전개 
• 문자 인식, 이미지 처리 등 소소한 일상 작업을 위한 다양한 RPA 툴을 포함 
• 대시보드, 스프레드시트, 또는 몇몇 커스텀 플랫폼으로 데이터가 표시되기를 원할 수 있는 다수의 고객에게 인사이트를 촉진하도록 설계 
• ‘디자이너(Designer)’ 등의 툴의 가격은 이용자당 연 5,195달러에서 시작하고 별도 요금은 판매 팀이 가격을 책정한다. 무료 시험 사용 및 오픈소스 옵션을 이용할 수 있다.  

AWS 세이지메이커(AWS SageMaker) 
아마존의 주력 AI 플랫폼인 세이지메이커(Sagemaker)는 아마존의 주요 데이터 소스 가운데 하나로부터 데이터를 분석한 뒤 자체적인 인스턴스에서나 서버리스 람다 함수의 일부로서 실행된다. 즉 여러 AWS 서비스와 원활히 통합되는 세이지메이커는 종합 예측 애널리틱스 서비스 플랫폼으로서의 면모를 지니고 있다. 

데이터 랭글러(Data Wrangler) 등의 데이터 준비 툴, 주피터 노트북으로 제작된 멋진 프레젠테이션 계층, 오토파일럿(Autopilot)이라고 불리는 자동화 선택지도 포함한다. 준수한 시각화 툴은 사용자가 단 한 번만 보아도 진행 현황을 즉시 이해할 수 있게 해준다.

• AWS 생태계의 여러 부분과 완전히 통합되어 있어 AWS 기반 운영을 위한 탁월한 선택지
• 서버리스 전개 옵션은 비용이 사용량에 따라 증가 
• 다른 세이지메이커 사용자들과 시장에서 모델 및 알고리즘을 사고 팔 수 있음 
• 각종 AWS 데이터베이스, 데이터 레이크, 여타 데이터 스토리지 옵션과 통합되어 있어서 대량 데이터세트와의 작업을 단순화시킴 
• 가격은 대개 사용자의 연산을 지원하는 데 쓰인 컴퓨팅 리소스의 크기에 연계됨. 무료 계층이 풍부해 실험이 가능 

H2O.ai AI 클라우드(AI Cloud) 
H2O.ai의 AI 클라우드(AI Cloud)는 ‘우수한 AI 알고리즘을 생산적인 인사이트로 변환하는 것’을 목표로 내세운다. 이 서비스의 ‘드라이버리스 AI(Driverless AI)’는 데이터를 흡수하고 두드러진 특징을 조사하기 위한 자동화된 파이프라인을 제공한다. 일련의 오픈소스 및 전매 엔지니어링 툴은 알고리즘을 데이터의 가장 중요한 부분에 집중시키는 데 유용하다. 결과는 일련의 대시보드나 자동화된 그래프 시각 정보로 제시된다.

• AI 에의 집중은 유입 데이터에 적응하는 복합적 솔루션을 요하는 문제에 가장 이상적임
• 대형의 데이터 중심 파이프라인을 생성하는 AI 클라우드, 데스크톱 사용자가 실시간 대시보드를 생성하는 데 도움을 주는 오픈 소스 파이썬 기반의 웨이브(Wave) 등의 툴이 있음. 
• 온-프레미스나 클라우드에서 네이티브로 실행 
• 핵심 플랫폼은 전면적인 오픈 소스임
• 기업 지원 및 클라우드 선택지에 대한 가격은 판매 팀에서 제공 

IBM SPSS 
통계학자들은 수십 년 동안 IBM의 SPSS를 사용해왔다. 이의 최신 버전은 머신러닝, 텍스트 분석, 여타 AI 알고리즘 등 최신 접근법을 통합하기 위한 각종 옵션도 내장하고 있다.

‘스태티스틱스(Statistics)’ 패키지는 무엇이 발생했는가에 관한 숫자적 설명에 집중한다. SPSS 모델러(SPSS Modeler)는 실용적 인사이트로 이어지는 데이터 파이프라인을 생성하는 드래그-앱-드롭 툴이다.

• 대량 데이터 흐름을 가진 전통적인 대기업에게 이상적임 
왓슨 스튜디오(Watson Studio) 등 다른 IBM 툴과 통합 
• IBM의 ‘신뢰성 있는 AI(Trustworthy AI)’ 추진 등 더 큰 이니셔티브를 활용 
• 가격은 이용자당 월 499달러에서 시작하고 풍부한 무료 시험 사용을 제공한다. 다른 조합의 가격은 판매 팀에 문의한다. 

래피드마이너(RapidMiner)
래피드마이너(RapiMiner)의 각종 도구는 일선 데이터 과학자을 우선 겨냥한 것들이다. 핵심 오퍼링은 다양한 데이터 흐름을 가지고 실험하며 인사이트를 발견하는 완전히 시각적인 IDE(complete visual IDE)이다. 이 제품 계열은 이제 기업 내에서 더 많은 사람에게 개방될 수 있는 자동화된 솔루션을 포함하고 있다. 데이터를 정화하고 적합한 모델링 솔루션을 발견하기 위한 안내 형식의 툴과 단순한 인터페이스를 앞세움으로써다 또한 래피드마이너는 도입을 단순화하도록 설계된 ‘AI 허브(AI Hub)’와 함께 클라우드 오퍼링도 확장해왔다. 

• 예측의 근거가 되는 이유를 이해할 필요가 있는 사용자를 위해 투명성을 제공
• 주피터 노트북 위주의 AI 허브를 통해 AI 과학자와 사용자 간의 협업을 촉진 
• 파이썬 기반 오픈 소스 툴링을 강력히 지원  
• 무료 티어가 광범위하고, 조기 실험과 교육 프로그램을 위해 래피드마이너 스튜디오(RapidMiner Studio)를 제공 
• 대형 프로젝트 및 실무 전개를 위한 가격은 요청 시 제공 

SAP 
제조업 종사자라면 누구나 SAP 소프트웨어를 알고 있다. 이의 데이터베이스는 공급망을 따라 모든 단계에서 물품을 추적한다. 따라서 앞으로 일어날 일에 대해 현명한 결정을 내릴 수 있게 해주는 우수한 예측 애널리틱스 툴을 개발하는 데 SAP가 막대한 투자를 했다는 것은 새삼스러울 게 없다. 

툴은 비즈니스 인텔리전스 및 보고에 크게 치중하교 예측은 애널리틱스 프레젠테이션에서 단지 한 열을 차지할 뿐이다. 과거로부터 나온 정보는 지극히 자동화된 일련의 머신러닝 루틴을 통해 미래에 대한 결정으로 스며든다. 이들을 실행하는 데 굳이 AI 프로그래머가 될 것까지는 없다. 실제로 이들은 이른바 ‘대화형 애널리틱스(conversational analytics)’를 개발하기 위해 노력했고, 이는 인간의 언어로 질문하는 사람에게 유용한 인사이트를 제공할 수 있다. 

• SAP의 웨어하우스 및 공급망 관리 소프트웨어와의 깊은 통합에 이미 의존하고 있는 스택에 이상적임. 
• 로우-코드 및 노-코드 전략 하에서 설계되어 애널리틱스를 모든 사람에게 개방 
• 정규 비즈니스 인텔리전스 프로세스에 일관성과 단순성을 가미 
• 사용자는 AI가 어떻게 결정을 내리는지를 이해할 수 있도록 예측의 전후 배경을 질문할 수 있음  
• 무료 요금제는 실험을 허용한다. 기본 요금제는 이용자당 월 36달러에서 시작한다. 더 많은 자동화와 통합이 포함된 요금제는 판매 팀에게 문의해 이용할 수 있다. 

SAS 
SAS의 오래된 통계 및 비즈니스 인텔리전스 패키지는 지속적으로 고도화되어 왔다. 예측을 필요로 하는 기업은 SAS가 ‘복합 AI(composite AI)’라고 부르는 통계 및 머신러닝 알고리즘을 활용해 미래를 전망하는 보고서를 생성할 수 있다. 제품 계열은 비주얼 데이터 마이닝(Visual Data Mining), 비주얼 포캐스팅(Visual Forecasting) 등 기본적인 탐색을 위한 툴들로 분리된다. 또한 잠재적인 컴플라이언스 문제를 예측하도록 설계된 안티-머니 론더링(Anti-Money Laundering) 등 특정한 업종을 위한 전문 툴도 있다. 

• 은행 등 특정 업종을 위해 미리 최적화되어 있는 다양한 전문 툴 
• 전통적인 통계와 현대의 머신러닝의 탁월한 결합 
• 온-프레미스 및 클라우드에서 모두 전개할 수 있도록 설계 
• 가격은 제품 선택 및 사용량에 크게 좌우됨  

팁코 
데이터가 다양한 통합 툴에 의해 수집되면 팁코의 예측 애널리틱스가 예측을 생성하기 시작한다. 데이터 사이언스 스튜디오(Data Science Studio)는 팀들이 협력해 로우-코드 및 노-코드 애널리틱스를 생성하는 것을 지원하도록 설계됐다. 팁코 스트리밍은 시계열 이벤트로부터 실시간 결정을 생성하도록 최적화되었다. 스폿파이어(Spotfire)는 위치 기반 데이터를 과거의 결과들과 통합하면서 대시보드를 생성한다. 툴들은 데이터 수집, 통합, 저장을 지원하도록 설계된 회사의 다른 제품군와 함께 동작한다.

• 대형 데이터 관리 아키텍처를 지원하는 데 탁월 
• 예측 애널리틱스는 몇몇 데이터 이동 및 스토리지 선택지와 통합됨 
• 보고서 및 비즈니스 인텔리전스를 생성하는 전통에 입각해 개발됨 
• 머신러닝 및 여타 AI 선택지로 정확성을 개선 
• 클라우드 및 온-프레미스 선택지에 따라 개별적으로 책정되는 다양한 요금제가 있다. 턴-키 AWS 인스턴스는 시간당 99센트에서 시작한다. 판매 팀에 의해 가격이 책정되는 선택지가 많다. 
ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.