Offcanvas

��������� ������

여전히 ‘21세기 가장 섹시한 직업’일까? 데이터 과학자들이 '대탈출'하는 이유

최신 보고서에 따르면 데이터 전문가의 무려 97%가 번아웃에 빠져 있다고 느끼며, 79%는 이 업계를 완전히 떠나는 것을 고려하고 있다. 숙련된 데이터 과학자가 크게 부족한 상황에서 이 수치는 경종을 울린다. ‘데이터 과학자의 이탈’ 이면에는 무엇이 있으며, 기업들이 어떻게 하면 이전의 ‘21세기 가장 섹시한 직업’이라는 영광을 되찾을 수 있을까?  ‘데이터 과학자’는 데이터 과학 분야의 초기 단계부터 일약 스타가 됐다. 데이터가 성공적인 비즈니스의 핵심 요소가 되고, 그 어느 때보다 (데이터의) 접근성이 높아지면서 데이터 전문가는 새로운 직함으로 CV를 업데이트했고 요구할 수 있는 연봉이 순식간에 올라갔다. 데이터베이스 전문가, 수학자, 통계학자, 물리학자들은 데이터 과학 산업으로 가장 먼저 향했다. 처음부터 코드를 작성하고, 상대적으로 제한됐던 데이터 소스에서 얻은 인사이트를 활용했다. 하지만 가장 큰 문제는 서로 다른 부서가 소유하고, 다양한 사람이 관리하며, 접근이 어려운 데이터 사일로에 저장된 데이터를 연결하는 것이었다.  (당시에는) 이러한 새로운 스킬을 알려주는 공식적인 데이터 과학 교육이 없었기 때문에 데이터 기반 인사이트를 제공하기 위해 자신의 코딩 지식을 활용해야 했다. 업무의 자유도가 높았고, 비즈니스 가치를 창출하기 위해 기하급수적으로 높은 수준의 기술 전문성이 필요했다. 데이븐포트 교수와 파틸 교수는 2012년 10월 하버드 비즈니스 리뷰(HBR)에 “데이터 과학자는 21세기 가장 섹시한 직업(Data Scientist: The Sexxist Job of the 21st Century)’이라고 천명했다. 그야말로 데이터 과학자의 황금기였다.      20년이 지난 지금, 무엇이 바뀌었는가?  물론 2022년에도 데이터 과학자 수요는 여전히 높고, 계속 증가하고 있다. 링크드인에 따르면 현재 영국에서만 4만 4,000건의 데이터 과학자 구인 공고가 있다. 데이터 기반 인사이트가 ...

데이터 과학 데이터 과학자 커리어 IT 스킬 인력 관리 인재 관리

16시 19분

최신 보고서에 따르면 데이터 전문가의 무려 97%가 번아웃에 빠져 있다고 느끼며, 79%는 이 업계를 완전히 떠나는 것을 고려하고 있다. 숙련된 데이터 과학자가 크게 부족한 상황에서 이 수치는 경종을 울린다. ‘데이터 과학자의 이탈’ 이면에는 무엇이 있으며, 기업들이 어떻게 하면 이전의 ‘21세기 가장 섹시한 직업’이라는 영광을 되찾을 수 있을까?  ‘데이터 과학자’는 데이터 과학 분야의 초기 단계부터 일약 스타가 됐다. 데이터가 성공적인 비즈니스의 핵심 요소가 되고, 그 어느 때보다 (데이터의) 접근성이 높아지면서 데이터 전문가는 새로운 직함으로 CV를 업데이트했고 요구할 수 있는 연봉이 순식간에 올라갔다. 데이터베이스 전문가, 수학자, 통계학자, 물리학자들은 데이터 과학 산업으로 가장 먼저 향했다. 처음부터 코드를 작성하고, 상대적으로 제한됐던 데이터 소스에서 얻은 인사이트를 활용했다. 하지만 가장 큰 문제는 서로 다른 부서가 소유하고, 다양한 사람이 관리하며, 접근이 어려운 데이터 사일로에 저장된 데이터를 연결하는 것이었다.  (당시에는) 이러한 새로운 스킬을 알려주는 공식적인 데이터 과학 교육이 없었기 때문에 데이터 기반 인사이트를 제공하기 위해 자신의 코딩 지식을 활용해야 했다. 업무의 자유도가 높았고, 비즈니스 가치를 창출하기 위해 기하급수적으로 높은 수준의 기술 전문성이 필요했다. 데이븐포트 교수와 파틸 교수는 2012년 10월 하버드 비즈니스 리뷰(HBR)에 “데이터 과학자는 21세기 가장 섹시한 직업(Data Scientist: The Sexxist Job of the 21st Century)’이라고 천명했다. 그야말로 데이터 과학자의 황금기였다.      20년이 지난 지금, 무엇이 바뀌었는가?  물론 2022년에도 데이터 과학자 수요는 여전히 높고, 계속 증가하고 있다. 링크드인에 따르면 현재 영국에서만 4만 4,000건의 데이터 과학자 구인 공고가 있다. 데이터 기반 인사이트가 ...

16시 19분

기고ㅣ파일럿에서 프로덕션까지, ‘AI 프로젝트’ 시작하고 성공하는 법

성과를 개선할 수 있는, 즉 비즈니스에 영향을 미치는 영역에서 성공을 거두려는 CIO라면 데이터 과학, ML, AI 프로젝트를 검토해야 한다.  인도의 AI 프로젝트를 조사한 최근의 IDC 보고서에 따르면 AI 프로젝트의 30~49%가 기업의 약 3분의 1에서 실패했다. 또 딜로이트 보고서에 의하면 전체 응답자의 50%가 (소속 기업의) AI 성과를 ‘아직 시작하는 또는 저조한 상태’라고 지적했다. 한편 전체 응답자의 94%는 AI가 앞으로 5년 동안의 (비즈니스) 성공에 매우 중요하다고 말했다. 경영진은 AI를 통해 차별화할 기회를 보고 있으며, 성공적인 결과를 제공할 리더도 찾고 있는 것으로 조사됐다.    ML과 AI는 상대적으로 여전히 새로운 영역이며, (따라서) 리더들은 지속적인 학습과 성숙도 향상을 추진해야 한다. 여기서 CIO, CDO 및 수석 과학자가 파일럿부터 프로덕션까지 AI 프로젝트 진행을 개선하는 데 중요한 역할을 할 수 있다.  데이터 과학팀이 성공을 위한 준비가 돼 있는가?  데이터 과학팀을 위한 베스트 프랙티스 개발 플레이북은 ML 모델을 구축하고 테스트하는 개발 프로세스와 기술을 다룬다. 모델 구축은 쉬운 일이 아니며, 데이터 과학자는 데이터 정제 및 태그 지정, 알고리즘 선택, 모델 구성, 인프라 설정 및 결과 검증에 어려움을 겪고 있다.  AI 딜리버리 성능을 향상하려는 리더는 우선 다음의 첫 번째 질문을 해결해야 한다. 데이터 과학자가 성공을 위해 준비됐는가? 의미 있는 비즈니스 결과를 도출할 문제를 해결하고 있는가? 머신러닝 플랫폼(예: 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)), 인프라 액세스, 데이터 과학 관행을 개선하기 위한 지속적인 교육 시간이 있는가? CIO와 CDO가 모델옵스(ModelOps)를 주도하고 라이프사이클을 감독해야 한다 데이터 과학팀이 모델 개발에 어려움을 겪는다면 리더는 이러한 문제를 검토하고 해결할 수 있어야 ...

AI 프로젝트 파일럿 프로덕션 CIO CDO 데이터 과학 모델옵스 ML옵스

2022.11.08

성과를 개선할 수 있는, 즉 비즈니스에 영향을 미치는 영역에서 성공을 거두려는 CIO라면 데이터 과학, ML, AI 프로젝트를 검토해야 한다.  인도의 AI 프로젝트를 조사한 최근의 IDC 보고서에 따르면 AI 프로젝트의 30~49%가 기업의 약 3분의 1에서 실패했다. 또 딜로이트 보고서에 의하면 전체 응답자의 50%가 (소속 기업의) AI 성과를 ‘아직 시작하는 또는 저조한 상태’라고 지적했다. 한편 전체 응답자의 94%는 AI가 앞으로 5년 동안의 (비즈니스) 성공에 매우 중요하다고 말했다. 경영진은 AI를 통해 차별화할 기회를 보고 있으며, 성공적인 결과를 제공할 리더도 찾고 있는 것으로 조사됐다.    ML과 AI는 상대적으로 여전히 새로운 영역이며, (따라서) 리더들은 지속적인 학습과 성숙도 향상을 추진해야 한다. 여기서 CIO, CDO 및 수석 과학자가 파일럿부터 프로덕션까지 AI 프로젝트 진행을 개선하는 데 중요한 역할을 할 수 있다.  데이터 과학팀이 성공을 위한 준비가 돼 있는가?  데이터 과학팀을 위한 베스트 프랙티스 개발 플레이북은 ML 모델을 구축하고 테스트하는 개발 프로세스와 기술을 다룬다. 모델 구축은 쉬운 일이 아니며, 데이터 과학자는 데이터 정제 및 태그 지정, 알고리즘 선택, 모델 구성, 인프라 설정 및 결과 검증에 어려움을 겪고 있다.  AI 딜리버리 성능을 향상하려는 리더는 우선 다음의 첫 번째 질문을 해결해야 한다. 데이터 과학자가 성공을 위해 준비됐는가? 의미 있는 비즈니스 결과를 도출할 문제를 해결하고 있는가? 머신러닝 플랫폼(예: 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)), 인프라 액세스, 데이터 과학 관행을 개선하기 위한 지속적인 교육 시간이 있는가? CIO와 CDO가 모델옵스(ModelOps)를 주도하고 라이프사이클을 감독해야 한다 데이터 과학팀이 모델 개발에 어려움을 겪는다면 리더는 이러한 문제를 검토하고 해결할 수 있어야 ...

2022.11.08

데이터 과학 생산성 Up! ‘모델옵스’의 5가지 기능 살펴보기

‘2022 모델옵스 현황(State of Modelops 2022)’ 보고서에 따르면 대기업의 51%가 초기 단계의 인공지능 파일럿 또는 실험을 했지만 아직 프로덕션 환경에는 투입하지 않은 것으로 나타났다. 38%만이 AI 투자수익률(ROI)을 이야기할 수 있다고 말했으며, 43%는 적시에 문제를 찾고 해결하는 데 비효율적이라고 답했다.  이는 프로덕션 환경에서 ML 모델을 개발, 제공, 관리하는 ‘생산성’을 향상시킬 방법의 필요성을 강조한다.    ML옵스 또는 모델옵스? 둘 다 필요할 수 있다 알터릭스(Alteryx)부터 AWS 세이지메이커(AWS SageMaker), 다타이쿠(Dataiku), 데이터로봇(DataRobot), 구글 버텍스 AI(Google Vertex AI), 나임(KNIME), 마이크로소프트 애저 머신러닝(Microsoft Azure Machine Learning), SAS까지 오늘날 모델 개발을 위해 선택할 수 있는 애널리틱스 도구가 많다. 데이터 과학팀이 애널리틱스 도구를 통합하고, 실험하며, ML 모델을 배포할 수 있도록 지원하는 ML옵스 플랫폼도 있다.  레디AI(ReadyAI)의 총괄 관리자 겸 딜로이트 컨설팅(Deloitte Consulting)의 전무 로힛 탄돈은 대규모 AI 구축 및 배포에서 ML옵스의 역할을 다음과 같이 설명했다. “기업이 AI 개발 용량을 수십에서 수백 또는 수천 개의 ML 모델로 확장하려고 할 때, 데브옵스가 소프트웨어 개발에 가져온 것과 동일한 엔지니어링 및 운영 원칙의 이점을 누릴 수 있다. ML옵스는 수동적이고 비효율적인 워크플로우를 자동화하고 모델 구성 및 관리의 모든 단계를 간소화하는 데 유용하다.” 많은 ML옵스 플랫폼이 프로덕션 환경에서 배포 및 모니터링 모델을 지원하지만 주요 기능은 개발, 테스트, 프로세스 개선 과정에서 (데이터 과학자에게) 서비스를 제공하는 것이다.  모델옵스(Modelops) 플랫폼 및 프랙티스는 프로덕션 환경에...

데이터 과학 데이터 과학자 데브옵스 머신러닝 ML옵스 모델옵스 애널리틱스

2022.10.25

‘2022 모델옵스 현황(State of Modelops 2022)’ 보고서에 따르면 대기업의 51%가 초기 단계의 인공지능 파일럿 또는 실험을 했지만 아직 프로덕션 환경에는 투입하지 않은 것으로 나타났다. 38%만이 AI 투자수익률(ROI)을 이야기할 수 있다고 말했으며, 43%는 적시에 문제를 찾고 해결하는 데 비효율적이라고 답했다.  이는 프로덕션 환경에서 ML 모델을 개발, 제공, 관리하는 ‘생산성’을 향상시킬 방법의 필요성을 강조한다.    ML옵스 또는 모델옵스? 둘 다 필요할 수 있다 알터릭스(Alteryx)부터 AWS 세이지메이커(AWS SageMaker), 다타이쿠(Dataiku), 데이터로봇(DataRobot), 구글 버텍스 AI(Google Vertex AI), 나임(KNIME), 마이크로소프트 애저 머신러닝(Microsoft Azure Machine Learning), SAS까지 오늘날 모델 개발을 위해 선택할 수 있는 애널리틱스 도구가 많다. 데이터 과학팀이 애널리틱스 도구를 통합하고, 실험하며, ML 모델을 배포할 수 있도록 지원하는 ML옵스 플랫폼도 있다.  레디AI(ReadyAI)의 총괄 관리자 겸 딜로이트 컨설팅(Deloitte Consulting)의 전무 로힛 탄돈은 대규모 AI 구축 및 배포에서 ML옵스의 역할을 다음과 같이 설명했다. “기업이 AI 개발 용량을 수십에서 수백 또는 수천 개의 ML 모델로 확장하려고 할 때, 데브옵스가 소프트웨어 개발에 가져온 것과 동일한 엔지니어링 및 운영 원칙의 이점을 누릴 수 있다. ML옵스는 수동적이고 비효율적인 워크플로우를 자동화하고 모델 구성 및 관리의 모든 단계를 간소화하는 데 유용하다.” 많은 ML옵스 플랫폼이 프로덕션 환경에서 배포 및 모니터링 모델을 지원하지만 주요 기능은 개발, 테스트, 프로세스 개선 과정에서 (데이터 과학자에게) 서비스를 제공하는 것이다.  모델옵스(Modelops) 플랫폼 및 프랙티스는 프로덕션 환경에...

2022.10.25

블로그ㅣML 모델 ‘모니터링’이 중요한 이유

변화하는 가정과 끊임없이 바뀌는 데이터는 머신러닝 모델을 프로덕션에 배포한 후에도 작업이 끝나지 않는다는 의미다.  애자일 개발팀은 마이크로서비스, 애플리케이션, 데이터베이스를 관찰할 수 있어야 하고, 운영 문제를 파악하기 위한 모니터링 기능을 갖춰야 하며, AI옵스를 활용하여 관리 가능한 인시던트를 경고 알림과 연계시켜야 한다.  사용자와 비즈니스 이해관계자가 (모델) 개선을 요청할 때 많은 데브옵스 팀은 애자일 방법론을 따라 피드백을 처리하고 새 버전을 배포한다. 만약 요청이 없더라도 데브옵스 팀은 앱을 업그레이드하고, 기본 구성 요소를 패치해야 한다는 점을 알고 있다. 그렇지 않으면 오늘 개발된 소프트웨어가 내일의 기술 부채가 될 것이다.    머신러닝 모델의 라이프사이클 관리는 소프트웨어보다 더 복잡하다. 와이랩스(WhyLabs)의 공동설립자 겸 엔지니어링 부문 책임자 앤디 당은 “모델 개발 라이프사이클은 하이 레벨에서 소프트웨어 개발 라이프사이클과 유사하지만 훨씬 더 복잡하다. 소프트웨어는 코드로 취급되지만 ML 모델의 기반인 데이터는 복잡하고, 고차원적이며, 동작을 예측할 수 없다”라고 전했다.  코드, 구성 요소, 인프라 외에도 모델은 알고리즘, 구성, 학습 데이터세트를 사용하여 구축된다. 이는 설계 당시에 선택 및 최적화되기 때문에, 시간이 지나면서 가정 및 데이터가 변경되면 업데이트를 해야 한다.  머신러닝 모델을 모니터링하는 이유 애플리케이션의 성능, 안정성, 오류 조건을 모니터링하는 것과 마찬가지로, 머신러닝 모델 모니터링은 데이터 과학자에게 모델 성능에 관한 가시성을 제공한다. 모니터링은 모델이 예측에 사용되거나 해당 ML이 변동성 높은 데이터 세트에서 실행될 때 특히 중요하다.  이터레이티브(Iterative)의 공동설립자 겸 CEO 드미트리 페트로프에 따르면 “ML 팀이 모델을 개선하고 모든 것이 의도한 대로 실행되길 원하기 때문에 모델 모니터링은 성능 및 문제...

머신러닝 인공지능 데이터 과학 애널리틱스 예측 애널리틱스

2022.10.04

변화하는 가정과 끊임없이 바뀌는 데이터는 머신러닝 모델을 프로덕션에 배포한 후에도 작업이 끝나지 않는다는 의미다.  애자일 개발팀은 마이크로서비스, 애플리케이션, 데이터베이스를 관찰할 수 있어야 하고, 운영 문제를 파악하기 위한 모니터링 기능을 갖춰야 하며, AI옵스를 활용하여 관리 가능한 인시던트를 경고 알림과 연계시켜야 한다.  사용자와 비즈니스 이해관계자가 (모델) 개선을 요청할 때 많은 데브옵스 팀은 애자일 방법론을 따라 피드백을 처리하고 새 버전을 배포한다. 만약 요청이 없더라도 데브옵스 팀은 앱을 업그레이드하고, 기본 구성 요소를 패치해야 한다는 점을 알고 있다. 그렇지 않으면 오늘 개발된 소프트웨어가 내일의 기술 부채가 될 것이다.    머신러닝 모델의 라이프사이클 관리는 소프트웨어보다 더 복잡하다. 와이랩스(WhyLabs)의 공동설립자 겸 엔지니어링 부문 책임자 앤디 당은 “모델 개발 라이프사이클은 하이 레벨에서 소프트웨어 개발 라이프사이클과 유사하지만 훨씬 더 복잡하다. 소프트웨어는 코드로 취급되지만 ML 모델의 기반인 데이터는 복잡하고, 고차원적이며, 동작을 예측할 수 없다”라고 전했다.  코드, 구성 요소, 인프라 외에도 모델은 알고리즘, 구성, 학습 데이터세트를 사용하여 구축된다. 이는 설계 당시에 선택 및 최적화되기 때문에, 시간이 지나면서 가정 및 데이터가 변경되면 업데이트를 해야 한다.  머신러닝 모델을 모니터링하는 이유 애플리케이션의 성능, 안정성, 오류 조건을 모니터링하는 것과 마찬가지로, 머신러닝 모델 모니터링은 데이터 과학자에게 모델 성능에 관한 가시성을 제공한다. 모니터링은 모델이 예측에 사용되거나 해당 ML이 변동성 높은 데이터 세트에서 실행될 때 특히 중요하다.  이터레이티브(Iterative)의 공동설립자 겸 CEO 드미트리 페트로프에 따르면 “ML 팀이 모델을 개선하고 모든 것이 의도한 대로 실행되길 원하기 때문에 모델 모니터링은 성능 및 문제...

2022.10.04

데이터 과학자 채용 '하늘의 별 따기'··· CIO들의 해법은?

계속되는 ‘데이터 과학자’ 부족으로 기업들은 데이터 팀을 재구성하고, 내부 직원을 업스킬링하며, 파트너십을 통해 인재 파이프라인을 강화하고 있다.  美 금융 서비스 기업의 IT 리더들은 증가하는 데이터를 제대로 활용하기 위해 데이터 과학자를 확보하고자 했지만 지난 몇 년 동안 데이터 과학자 채용에 어려움을 겪어 왔다. 그리고 이러한 문제를 해결하기 위해 IT 리더들은 창의성을 발휘해야 했다. 이제 IT 리더들은 (데이터 과학자를 채용하기 위해) 원격근무와 유연한 근무 시간만 제공하지 않는다. 이를테면 대학들과 파트너십을 맺고 인턴 파이프라인을 구축하여 인턴들이 기업에서 데이터 과학 경험을 얻고 졸업 이후 채용될 수 있도록 했다.    미화 620억 달러 이상의 예금을 보유하고 있으며, 직원 수는 1만 8,000명 이상인 美 금융기업 싱크로니(Synchrony)의 수석 부사장 겸 CIO 베스 힐로는 “데이터가 엄청나게 늘어났지만 애널리스트 공급이 수요를 충족시키지 못하고 있다. 데이터를 기반으로 의사결정을 내리려고 하기 때문에 애널리스트 스킬이 절실하다. 싱크로니는 파이프라인 구축에 초점을 맞추고 있다”라고 말했다. 데이터 과학자 부족 문제를 겪고 있는 건 싱크로니 뿐만 아니다. 기업들은 이전에는 결코 다룰 수 없었던 복잡하고 어려운 문제를 해결할 수 있는 데이터 과학자를 채용하기 위해 고군분투하고 있다. 하지만 대기업 또는 선도기업이 아니라면 상황은 심각해진다. IT 인력도 확보하고 유지하기가 어려운 마당에 데이터 과학자를 찾기란 기하급수적으로 힘들어졌다. IDC의 최근 조사에 따르면 링크드인에 무려 21만 개의 데이터 과학 일자리가 등록돼 있다. 포레스터가 전 세계 데이터 및 애널리틱스 부문 의사결정자 2,329명을 대상으로 실시한 2021년 설문조사 결과에서도 전체 응답자의 55%가 데이터 과학자를 채용하고 싶다고 밝혔다. 62%는 데이터 엔지니어를 채용할 계획이며, 37%는 데이터 과학자를 지원할 머신러닝 엔지니어를 ...

데이터 과학 데이터 과학자 데이터 애널리틱스 업스킬링 인재 파이프라인

2022.08.03

계속되는 ‘데이터 과학자’ 부족으로 기업들은 데이터 팀을 재구성하고, 내부 직원을 업스킬링하며, 파트너십을 통해 인재 파이프라인을 강화하고 있다.  美 금융 서비스 기업의 IT 리더들은 증가하는 데이터를 제대로 활용하기 위해 데이터 과학자를 확보하고자 했지만 지난 몇 년 동안 데이터 과학자 채용에 어려움을 겪어 왔다. 그리고 이러한 문제를 해결하기 위해 IT 리더들은 창의성을 발휘해야 했다. 이제 IT 리더들은 (데이터 과학자를 채용하기 위해) 원격근무와 유연한 근무 시간만 제공하지 않는다. 이를테면 대학들과 파트너십을 맺고 인턴 파이프라인을 구축하여 인턴들이 기업에서 데이터 과학 경험을 얻고 졸업 이후 채용될 수 있도록 했다.    미화 620억 달러 이상의 예금을 보유하고 있으며, 직원 수는 1만 8,000명 이상인 美 금융기업 싱크로니(Synchrony)의 수석 부사장 겸 CIO 베스 힐로는 “데이터가 엄청나게 늘어났지만 애널리스트 공급이 수요를 충족시키지 못하고 있다. 데이터를 기반으로 의사결정을 내리려고 하기 때문에 애널리스트 스킬이 절실하다. 싱크로니는 파이프라인 구축에 초점을 맞추고 있다”라고 말했다. 데이터 과학자 부족 문제를 겪고 있는 건 싱크로니 뿐만 아니다. 기업들은 이전에는 결코 다룰 수 없었던 복잡하고 어려운 문제를 해결할 수 있는 데이터 과학자를 채용하기 위해 고군분투하고 있다. 하지만 대기업 또는 선도기업이 아니라면 상황은 심각해진다. IT 인력도 확보하고 유지하기가 어려운 마당에 데이터 과학자를 찾기란 기하급수적으로 힘들어졌다. IDC의 최근 조사에 따르면 링크드인에 무려 21만 개의 데이터 과학 일자리가 등록돼 있다. 포레스터가 전 세계 데이터 및 애널리틱스 부문 의사결정자 2,329명을 대상으로 실시한 2021년 설문조사 결과에서도 전체 응답자의 55%가 데이터 과학자를 채용하고 싶다고 밝혔다. 62%는 데이터 엔지니어를 채용할 계획이며, 37%는 데이터 과학자를 지원할 머신러닝 엔지니어를 ...

2022.08.03

R스튜디오, 포싯(Posit)으로 사명 바꾼다

R스튜디오가 회사 이름을 ‘포싯(Posit)’으로 변경한다. 27일(현지 시각) 美 워싱턴 D.C.에서 열린 연례 사용자 컨퍼런스에서 이 회사는 R을 넘어 파이썬 및 비주얼 스튜디오 코드 사용자까지 포함하기 위해 사명을 바꾼다고 발표했다.  이 회사는 지난 몇 년 동안 자사의 상용 제품이 R과 파이썬 모두를 지원하는 ‘이중 언어’라고 강조해 왔다. 하지만 ‘R스튜디오’라는 브랜드로 인해 파이썬 사용자가 자사 제품을 고려하도록 설득하는 게 어려웠다는 설명이다. R스튜디오의 수석 과학자 해들리 위컴은 “그 이름이 제한적이라고 느꼈다”라고 말했다.    R스튜디오 설립자 겸 CEO J.J. 알레르는 “하지만 이름 변경이 소셜 미디어 등에서 주장하는 것처럼 R에서 벗어나거나, 파이썬이 데이터 과학에서 R을 대체하고 있다는 믿음을 의미하진 않는다”라고 언급했다. 위컴은 “R에서 파이썬으로 전환하는 게 아니다”라면서, “R 코드 작성을 멈추지 않을 것”이라고 전했다.  알레르는 그 대신 관련 상용 제품의 수익을 통해 오픈소스 소프트웨어에 안정적으로 자금을 조달할 수 있는 모델을 찾았다고 밝혔다. 그는 “데이터 과학 관행에 폭넓게 영향을 미칠 기회가 있다고 생각한다”라고 덧붙였다.  알레르에 따르면 내부 엔지니어의 약 40%가 풀타임으로 오픈소스 소프트웨어에 전념하고 있다. 오픈소스 개발 작업에 참여하지만 풀타임으론 일하지 않는 직원들을 제외하면 총 43명이다. 2020년 R스튜디오는 공익법인으로 개편했다고 발표했다. 이를 통해 의사결정을 내릴 때 주주 가치 극대화에 초점을 맞추는 대신, 광범위한 사용자 커뮤니티의 요구를 고려할 수 있게 됐다.  현재 내부 엔지니어의 90%가 R을 다루고 있지만 알레르는 약 3년 후에는 (그 비율이) 약 75% 수준일 것이라고 추정했다. 하지만 단기적으로는 R과 관련한 개발 작업의 대부분을 유지할 예정이다. 단, 더 이상 첫 번째 제품인 ‘R스튜디오 IDE’라는 이름으로 알려...

R스튜디오 포싯 데이터 과학 R 파이썬 VS 코드 통합개발환경 IDE

2022.07.28

R스튜디오가 회사 이름을 ‘포싯(Posit)’으로 변경한다. 27일(현지 시각) 美 워싱턴 D.C.에서 열린 연례 사용자 컨퍼런스에서 이 회사는 R을 넘어 파이썬 및 비주얼 스튜디오 코드 사용자까지 포함하기 위해 사명을 바꾼다고 발표했다.  이 회사는 지난 몇 년 동안 자사의 상용 제품이 R과 파이썬 모두를 지원하는 ‘이중 언어’라고 강조해 왔다. 하지만 ‘R스튜디오’라는 브랜드로 인해 파이썬 사용자가 자사 제품을 고려하도록 설득하는 게 어려웠다는 설명이다. R스튜디오의 수석 과학자 해들리 위컴은 “그 이름이 제한적이라고 느꼈다”라고 말했다.    R스튜디오 설립자 겸 CEO J.J. 알레르는 “하지만 이름 변경이 소셜 미디어 등에서 주장하는 것처럼 R에서 벗어나거나, 파이썬이 데이터 과학에서 R을 대체하고 있다는 믿음을 의미하진 않는다”라고 언급했다. 위컴은 “R에서 파이썬으로 전환하는 게 아니다”라면서, “R 코드 작성을 멈추지 않을 것”이라고 전했다.  알레르는 그 대신 관련 상용 제품의 수익을 통해 오픈소스 소프트웨어에 안정적으로 자금을 조달할 수 있는 모델을 찾았다고 밝혔다. 그는 “데이터 과학 관행에 폭넓게 영향을 미칠 기회가 있다고 생각한다”라고 덧붙였다.  알레르에 따르면 내부 엔지니어의 약 40%가 풀타임으로 오픈소스 소프트웨어에 전념하고 있다. 오픈소스 개발 작업에 참여하지만 풀타임으론 일하지 않는 직원들을 제외하면 총 43명이다. 2020년 R스튜디오는 공익법인으로 개편했다고 발표했다. 이를 통해 의사결정을 내릴 때 주주 가치 극대화에 초점을 맞추는 대신, 광범위한 사용자 커뮤니티의 요구를 고려할 수 있게 됐다.  현재 내부 엔지니어의 90%가 R을 다루고 있지만 알레르는 약 3년 후에는 (그 비율이) 약 75% 수준일 것이라고 추정했다. 하지만 단기적으로는 R과 관련한 개발 작업의 대부분을 유지할 예정이다. 단, 더 이상 첫 번째 제품인 ‘R스튜디오 IDE’라는 이름으로 알려...

2022.07.28

‘이러려고 데이터 관리하나 자괴감’··· 11가지 어두운 비밀

어떤 이들은 데이터를 새로운 석유라 부르고, 누군가는 새로운 금이라고도 부른다. 철학자와 경제학자들은 비유의 적절성을 두고 논쟁할 수 있겠지만, 데이터 기반 의사 결정을 도모하는 기업에게 데이터 구성 및 분석이 필수적이라는 점은 의심의 여지가 없다. 일단은 견고한 데이터 관리 전략이 핵심이다. 데이터 거버넌스, 데이터 운영, 데이터 웨어하우징, 데이터 엔지니어링, 데이터 분석, 데이터 과학 등을 포괄하는 데이터 관리는 올바르게 수행될 경우 각종 비즈니스에서 경쟁 우위를 가져다줄 수 있다. 좋은 소식은 데이터 관리의 많은 측면이 잘 정립돼 있으며 수십 년 동안 발전해 온 원칙이 존재한다는 점이다. 예를 들어, 적용하기 어렵거나 이해하기에 간단하지 않을 수 있지만 과학자와 수학자들 모두 덕분에 기업은 이제 데이터를 분석하고 결론을 내리기 위한 다양한 프레임워크를 갖게 되었다. 분석 한계를 나타내는 오차 막대를 그리는 통계 모델도 있다. 그러나 데이터 과학과 이를 뒷받침하는 다양한 학문에 대한 연구에서 얻은 모든 장점에도 불구하고 우리는 머리를 긁적거릴 때가 있다. 기업들은 종종 현장의 한계에 부딪힌다. 때로는 너무 많은 데이터를 수집하고 구성하는 역설적인 문제도 있다. 일부는 철학적이며 우리의 추상적 역량을 시험한다. 그리고 처음에 개인 정보 보호 문제가 대두되고 있다. 다음은 수많은 기업에서 데이터 관리를 어려운 과제로 만드는 몇 가지 어두운 비밀들이다.   애물단지 비정형 데이터 기업 아카이브에 저장되어 있는 데이터의 대부분은 구조화되어 있지 않다. 은행의 콜센터 직원이 작성한 문자 메모를 검색하기 위한 인공 지능(AI) 사용을 원하는 경우가 있다. 이 문장에는 은행의 대출 및 서비스를 개선하는 데 도움이 될 수 있는 통찰이 담겨 있을 수 있다. 그러나 메모 데이터는 기록할 내용에 관해 서로 다른 생각을 가진 수백 명의 사람들이 작성한 것이다. 또한, 직원들은 서로 다른 작문 스타일과 능력을 가지고 있고, 일부는 전혀 쓰지 않았다. 또 어...

데이터 관리 데이터 과학 데이터 웨어하우징 데이터 거버넌스 데이터 엔지니어링 데이터 애널리틱스

2022.06.30

어떤 이들은 데이터를 새로운 석유라 부르고, 누군가는 새로운 금이라고도 부른다. 철학자와 경제학자들은 비유의 적절성을 두고 논쟁할 수 있겠지만, 데이터 기반 의사 결정을 도모하는 기업에게 데이터 구성 및 분석이 필수적이라는 점은 의심의 여지가 없다. 일단은 견고한 데이터 관리 전략이 핵심이다. 데이터 거버넌스, 데이터 운영, 데이터 웨어하우징, 데이터 엔지니어링, 데이터 분석, 데이터 과학 등을 포괄하는 데이터 관리는 올바르게 수행될 경우 각종 비즈니스에서 경쟁 우위를 가져다줄 수 있다. 좋은 소식은 데이터 관리의 많은 측면이 잘 정립돼 있으며 수십 년 동안 발전해 온 원칙이 존재한다는 점이다. 예를 들어, 적용하기 어렵거나 이해하기에 간단하지 않을 수 있지만 과학자와 수학자들 모두 덕분에 기업은 이제 데이터를 분석하고 결론을 내리기 위한 다양한 프레임워크를 갖게 되었다. 분석 한계를 나타내는 오차 막대를 그리는 통계 모델도 있다. 그러나 데이터 과학과 이를 뒷받침하는 다양한 학문에 대한 연구에서 얻은 모든 장점에도 불구하고 우리는 머리를 긁적거릴 때가 있다. 기업들은 종종 현장의 한계에 부딪힌다. 때로는 너무 많은 데이터를 수집하고 구성하는 역설적인 문제도 있다. 일부는 철학적이며 우리의 추상적 역량을 시험한다. 그리고 처음에 개인 정보 보호 문제가 대두되고 있다. 다음은 수많은 기업에서 데이터 관리를 어려운 과제로 만드는 몇 가지 어두운 비밀들이다.   애물단지 비정형 데이터 기업 아카이브에 저장되어 있는 데이터의 대부분은 구조화되어 있지 않다. 은행의 콜센터 직원이 작성한 문자 메모를 검색하기 위한 인공 지능(AI) 사용을 원하는 경우가 있다. 이 문장에는 은행의 대출 및 서비스를 개선하는 데 도움이 될 수 있는 통찰이 담겨 있을 수 있다. 그러나 메모 데이터는 기록할 내용에 관해 서로 다른 생각을 가진 수백 명의 사람들이 작성한 것이다. 또한, 직원들은 서로 다른 작문 스타일과 능력을 가지고 있고, 일부는 전혀 쓰지 않았다. 또 어...

2022.06.30

오픈소스 MPP 데이터 웨어하우스, ‘아파치 도리스’란? 

‘그’가 누구이고, 어떤 학교에 다녔는지 궁금한가? ‘아파치 도리스(Apache Doris)’는 아파치 인큐베이터(Apache Incubator)에서 개발한 오픈소스 MPP 분석 데이터 웨어하우스다. 지난주 아파치 소프트웨어 재단(Apache Software Foundation; ASF)은 도리스가 최상위 수준 프로젝트(Top-Level Project; TLP)로 승격했다고 발표했다.  MySQL 애널리틱스를 활용하는 이 SQL 기반 데이터 웨어하우스는 최근 버전 1.0 그리고 도리스를 다양한 애널리틱스 및 처리 기술과 연결하는 6개의 커넥터 릴리즈를 함께 출시했다(버전 1.0은 여덟 번째 릴리즈다). 특히 이는 데이터 과학 시나리오에서 자주 사용되는 온라인 분석 처리(OLAP) 워크로드를 지원하기 위해 개발됐다.  도리스는 중국의 인터넷 검색 대기업 바이두(Baidu)에서 태어났으며, 당시에는 ‘팔로(Palo)’라고 불렸다. 2017년 오픈소스화되고, 이어 2018년 아파치 인큐베이터에 기증되기 전까지 (바이두의) 광고 비즈니스를 위한 데이터 웨어하우징 시스템으로 사용됐다.    아파치 임팔라 및 구글 매사를 기반으로 하는 도리스 도리스는 구글 F1(Google F1)을 토대로 2012년 개발된 오픈소스 MPP SQL 쿼리 엔진 구글 매사(Google Mesa)와 아파치 임팔라(Apache Impala)의 기술 통합을 바탕으로 한다. 2014년경 확장성이 뛰어난 분석 데이터 웨어하우징 시스템으로 설계된 매사는 구글의 인터넷 광고 비즈니스와 관련된 중요한 측정 데이터를 저장하는 데 활용됐다.  바이두와 아파치 인큐베이터의 개발자에 따르면 이 데이터베이스는 고가용성, 안정성, 내결함성, 확장성은 물론 단순한 설계 아키텍처까지 제공한다. 아파치 소프트웨어 재단은 공식 성명에서 “단일 시스템(에서의 개발, 배포, 사용)과 많은 데이터 제공 요건을 충족하는 게 도리스의 주요 기능이다”라면서, “이 데이터 웨어하우수...

오픈소스 데이터 웨어하우스 아파치 도리스 아파치 소프트웨어 재단 아파치 인큐베이터 MPP 데이터 과학 바이두 오픈소스 데이터베이스

2022.06.24

‘그’가 누구이고, 어떤 학교에 다녔는지 궁금한가? ‘아파치 도리스(Apache Doris)’는 아파치 인큐베이터(Apache Incubator)에서 개발한 오픈소스 MPP 분석 데이터 웨어하우스다. 지난주 아파치 소프트웨어 재단(Apache Software Foundation; ASF)은 도리스가 최상위 수준 프로젝트(Top-Level Project; TLP)로 승격했다고 발표했다.  MySQL 애널리틱스를 활용하는 이 SQL 기반 데이터 웨어하우스는 최근 버전 1.0 그리고 도리스를 다양한 애널리틱스 및 처리 기술과 연결하는 6개의 커넥터 릴리즈를 함께 출시했다(버전 1.0은 여덟 번째 릴리즈다). 특히 이는 데이터 과학 시나리오에서 자주 사용되는 온라인 분석 처리(OLAP) 워크로드를 지원하기 위해 개발됐다.  도리스는 중국의 인터넷 검색 대기업 바이두(Baidu)에서 태어났으며, 당시에는 ‘팔로(Palo)’라고 불렸다. 2017년 오픈소스화되고, 이어 2018년 아파치 인큐베이터에 기증되기 전까지 (바이두의) 광고 비즈니스를 위한 데이터 웨어하우징 시스템으로 사용됐다.    아파치 임팔라 및 구글 매사를 기반으로 하는 도리스 도리스는 구글 F1(Google F1)을 토대로 2012년 개발된 오픈소스 MPP SQL 쿼리 엔진 구글 매사(Google Mesa)와 아파치 임팔라(Apache Impala)의 기술 통합을 바탕으로 한다. 2014년경 확장성이 뛰어난 분석 데이터 웨어하우징 시스템으로 설계된 매사는 구글의 인터넷 광고 비즈니스와 관련된 중요한 측정 데이터를 저장하는 데 활용됐다.  바이두와 아파치 인큐베이터의 개발자에 따르면 이 데이터베이스는 고가용성, 안정성, 내결함성, 확장성은 물론 단순한 설계 아키텍처까지 제공한다. 아파치 소프트웨어 재단은 공식 성명에서 “단일 시스템(에서의 개발, 배포, 사용)과 많은 데이터 제공 요건을 충족하는 게 도리스의 주요 기능이다”라면서, “이 데이터 웨어하우수...

2022.06.24

주피터부터 R스튜디오까지··· ‘데이터 과학’ 필수템 8선

기업들이 비즈니스 가치를 얻기 위해 ‘데이터 과학’에 점점 더 관심을 기울이면서 이를 지원하는 도구도 급증하고 있다. 여기서는 데이터 과학자가 주로 사용하는 도구를 살펴본다.  데이터 과학 열기가 식을 줄 모른다. 한때 데이터를 수집하고 분석하는 일은 연구소에 있는 소수의 과학자만 할 수 있다고 간주됐다. 하지만 이제는 모든 기업이 데이터 과학을 활용해 조직을 간소화하고 고객을 만족시키고 싶어 한다. 데이터 과학 도구가 이러한 수요를 충족시키기 위해 성장 중이다. 불과 몇 년 전만 해도 데이터 과학자는 명령줄 그리고 몇 안 되는 오픈소스 패키지를 사용했다. 이제는 데이터 과학의 많은 허드렛일(예: 데이터 클렌징 등)을 처리하는 전문 도구가 속속 개발되고 있다.  규모도 변하고 있다. 원래 데이터 과학은 과학자가 열심히 실험한 후 행하는 숫자 작업에 불과했다. 이제 데이터 과학은 워크플로우의 가장 중요한 부분이다. 오늘날 기업들은 현황을 신속하게 파악하기 위해 비즈니스 보고에 수학적 분석을 통합하고 대시보드를 구축한다. 아울러 속도도 빨라지고 있다. 한때 연간 또는 분기로 이뤄졌던 분석 작업은 이제 실시간으로 실행된다. 기업들은 관리자와 직원이 현명한 결정을 내릴 뿐만 아니라 데이터 과학이 제공하는 모든 것을 활용할 수 있도록 현재 무슨 일이 일어나고 있는지 파악하고 싶어 한다.  여기서는 끝없는 데이터 흐름 분석에 정확성과 과학을 더하는 도구들을 소개한다.    주피터 노트북(Jupyter Notebooks) 단어, 코드, 데이터 묶음은 ‘공통어(lingua franca)’가 됐다. 변하지 않는 분석과 콘텐츠로 채워진 정적 PDF는 영구적 기록을 생성하기 때문에 여전히 가치 있지만 데이터 과학자는 하부의 메커니즘을 이리저리 손보고 싶어 한다. 주피터 노트북을 사용하면 단순히 정보를 확인하는 것 이상의 일을 할 수 있다. 노트북은 매스매티카(Mathermatica; 계산용 소프트웨어)의 유연성을 차용...

데이터 과학 데이터 애널리틱스 애널리틱스 도구 주피터 노트북 R스튜디오 스위브 니터 IDE GPU

2022.05.10

기업들이 비즈니스 가치를 얻기 위해 ‘데이터 과학’에 점점 더 관심을 기울이면서 이를 지원하는 도구도 급증하고 있다. 여기서는 데이터 과학자가 주로 사용하는 도구를 살펴본다.  데이터 과학 열기가 식을 줄 모른다. 한때 데이터를 수집하고 분석하는 일은 연구소에 있는 소수의 과학자만 할 수 있다고 간주됐다. 하지만 이제는 모든 기업이 데이터 과학을 활용해 조직을 간소화하고 고객을 만족시키고 싶어 한다. 데이터 과학 도구가 이러한 수요를 충족시키기 위해 성장 중이다. 불과 몇 년 전만 해도 데이터 과학자는 명령줄 그리고 몇 안 되는 오픈소스 패키지를 사용했다. 이제는 데이터 과학의 많은 허드렛일(예: 데이터 클렌징 등)을 처리하는 전문 도구가 속속 개발되고 있다.  규모도 변하고 있다. 원래 데이터 과학은 과학자가 열심히 실험한 후 행하는 숫자 작업에 불과했다. 이제 데이터 과학은 워크플로우의 가장 중요한 부분이다. 오늘날 기업들은 현황을 신속하게 파악하기 위해 비즈니스 보고에 수학적 분석을 통합하고 대시보드를 구축한다. 아울러 속도도 빨라지고 있다. 한때 연간 또는 분기로 이뤄졌던 분석 작업은 이제 실시간으로 실행된다. 기업들은 관리자와 직원이 현명한 결정을 내릴 뿐만 아니라 데이터 과학이 제공하는 모든 것을 활용할 수 있도록 현재 무슨 일이 일어나고 있는지 파악하고 싶어 한다.  여기서는 끝없는 데이터 흐름 분석에 정확성과 과학을 더하는 도구들을 소개한다.    주피터 노트북(Jupyter Notebooks) 단어, 코드, 데이터 묶음은 ‘공통어(lingua franca)’가 됐다. 변하지 않는 분석과 콘텐츠로 채워진 정적 PDF는 영구적 기록을 생성하기 때문에 여전히 가치 있지만 데이터 과학자는 하부의 메커니즘을 이리저리 손보고 싶어 한다. 주피터 노트북을 사용하면 단순히 정보를 확인하는 것 이상의 일을 할 수 있다. 노트북은 매스매티카(Mathermatica; 계산용 소프트웨어)의 유연성을 차용...

2022.05.10

이제 데이터도 서비스로... 눈 여겨 볼 ‘DaaS’ 벤더 11곳

데이터 기반 의사결정이나 디지털 서비스를 보완하고자 하지만 수중에 충분한 데이터가 없을 수 있는 기업들의 선택 폭이 넓어지고 있다.  오늘날 대부분 비즈니스의 중심에는 ‘데이터 기반 의사결정’과 ‘디지털 서비스’가 있다. 따라서 기업들은 (이를 위해) 충분한 데이터를 확보해야 한다. 하지만 비즈니스에 도움이 될 수 있는 모든 데이터를 내부적인 수단으로만 쉽게 생성, 정리, 분석할 수 있는 건 아니다. 기업들이 사용할 수 있는 데이터를 (유료로) 제공하는 ‘서비스형 데이터(Data as a Service; DaaS)’ 업체들을 살펴봐야 할 이유다.  누가 ‘서비스형 데이터(DaaS)’를 필요로 할까? 데이터를 원한다면 누구든지 필요하다. 때때로 DaaS 업체의 데이터는 (기업들의) 내부 작업 또는 자체 비즈니스 운영에서 나온다. 때로는 DaaS 업체가 수집한 외부 소스(대부분 오픈소스)에서 나오기도 한다. 이는 기업들이 자체적으로 처리할 수 없는 데이터 자산을 활용할 수 있도록 지원한다.    DaaS 오퍼링은 지난 수십 년 동안 발전해 왔지만 최근 개발자들은 유연한 사용량 기반 가격 정책을 가진 클라우드 모델이 (벤더가) 수익을 창출하려는 데이터 소스와 기업들을 더 쉽게 연결하는 데 도움을 줄 수 있다는 사실을 깨달았다. 아울러 DaaS 업체들은 오류를 수정하거나 격차를 메워 기업들이 자체적으로 수집한 데이터 품질을 개선하고, 더 많이 필요하다면 더 많은 데이터를 제공할 수도 있게 됐다. 이러한 방식을 통해 DaaS 업체들은 자체 개발한 데이터웨어하우스를 선별된 다른 소스와 교차 수정하여 개선할 수 있다.  이 분야는 빠르게 성장하고 있다. 몇몇 DaaS 업체는 정보 관리, 데이터 분석, 보고서 작성, 의사결정 지원 등의 기능을 강조한다. 데이터가 너무 많으면 과잉 또는 과부족이라는 점에서 데이터 자체를 강조하는 업체도 있다. 많은 도구는 개발을 간소화하고 스마트하게 만드는 방식을 따르고 있다. 로우코드 및...

데이터 디지털 서비스 서비스형 데이터 데이터 자산 애널리틱스 데이터 과학

2022.04.18

데이터 기반 의사결정이나 디지털 서비스를 보완하고자 하지만 수중에 충분한 데이터가 없을 수 있는 기업들의 선택 폭이 넓어지고 있다.  오늘날 대부분 비즈니스의 중심에는 ‘데이터 기반 의사결정’과 ‘디지털 서비스’가 있다. 따라서 기업들은 (이를 위해) 충분한 데이터를 확보해야 한다. 하지만 비즈니스에 도움이 될 수 있는 모든 데이터를 내부적인 수단으로만 쉽게 생성, 정리, 분석할 수 있는 건 아니다. 기업들이 사용할 수 있는 데이터를 (유료로) 제공하는 ‘서비스형 데이터(Data as a Service; DaaS)’ 업체들을 살펴봐야 할 이유다.  누가 ‘서비스형 데이터(DaaS)’를 필요로 할까? 데이터를 원한다면 누구든지 필요하다. 때때로 DaaS 업체의 데이터는 (기업들의) 내부 작업 또는 자체 비즈니스 운영에서 나온다. 때로는 DaaS 업체가 수집한 외부 소스(대부분 오픈소스)에서 나오기도 한다. 이는 기업들이 자체적으로 처리할 수 없는 데이터 자산을 활용할 수 있도록 지원한다.    DaaS 오퍼링은 지난 수십 년 동안 발전해 왔지만 최근 개발자들은 유연한 사용량 기반 가격 정책을 가진 클라우드 모델이 (벤더가) 수익을 창출하려는 데이터 소스와 기업들을 더 쉽게 연결하는 데 도움을 줄 수 있다는 사실을 깨달았다. 아울러 DaaS 업체들은 오류를 수정하거나 격차를 메워 기업들이 자체적으로 수집한 데이터 품질을 개선하고, 더 많이 필요하다면 더 많은 데이터를 제공할 수도 있게 됐다. 이러한 방식을 통해 DaaS 업체들은 자체 개발한 데이터웨어하우스를 선별된 다른 소스와 교차 수정하여 개선할 수 있다.  이 분야는 빠르게 성장하고 있다. 몇몇 DaaS 업체는 정보 관리, 데이터 분석, 보고서 작성, 의사결정 지원 등의 기능을 강조한다. 데이터가 너무 많으면 과잉 또는 과부족이라는 점에서 데이터 자체를 강조하는 업체도 있다. 많은 도구는 개발을 간소화하고 스마트하게 만드는 방식을 따르고 있다. 로우코드 및...

2022.04.18

‘멀티클라우드 전환’의 이점과 과제는… 美 프라이스라인 사례

프라이스라인(Priceline)은 실시간 애널리틱스와 클라우드 네이티브 기술을 최대한 활용하기 위해 멀티클라우드 마이그레이션을 진행 중이다. 하지만 그 과정에서 문제가 없는 건 아니다. 미국에서 코로나19 확산이 수그러들자 여행 업계가 속도를 내고 있다. 온라인 여행 서비스 기업 ‘프라이스라인(Priceline)’의 클라우드 트랜스포메이션도 마찬가지다. 트래블로시티(Travelocity), 익스피디아(Expedia), 호퍼(Hopper) 등과 경쟁하는 이 회사는 구글 클라우드 플랫폼(GCP)을 중심으로 한 멀티클라우드 마이그레이션의 중간 단계를 지나가고 있다.    프라이스라인의 CTO 마틴 브로드벡은 “디지털 트랜스포메이션을 추진하고 있다. 올해 자사 제품 플랫폼을 구글 클라우드와 연동되는 쿠버네티스로 현대화하는 작업을 마무리할 예정이다”라고 말했다. 오픈소스 컨테이너 관리 시스템인 쿠버네티스는 (프라이스라인의) 하드웨어 및 소프트웨어 프로비저닝을 최소화할 수 있도록 효율적인 수평 확장을 제공한다. 이는 고객 트래픽에 대응하는 데 있어 엄청난 유연성을 필요로 하는 이 비즈니스의 중요한 요소라고 그는 설명했다.  브로드벡에 따르면 쿠버네티스를 통해 프라이스라인 개발자는 프로덕션 환경에서 기능을 테스트하고 배포할 수 있게 됐다. 하지만 클라우드 네이티브 방법론 및 기술로의 전환은 특히 개발자 생산성 극대화와 관련해 완전히 순조롭지는 않았다고 그는 전했다.  클라우드에서의 실시간 애널리틱스 프라이스라인 비즈니스의 핵심이라고 할 수 있는 독점적인 가격 책정 엔진은 실시간 데이터 인프라와 애널리틱스를 활용한다. 이를 위해 프라이스라인은 테라바이트 단위의 데이터를 몇 초 만에 분석할 수 있는 구글 빅쿼리(Google BigQuery)와 카프카(Kafka)를 쓴다. 아울러 데이터스택스(DataStax)의 고속 쿼리 엔진과 스타버스터(Startbust)의 데이터 메시용 실시간 애널리틱스 플랫폼도 사용한다.  클라우드에...

멀티클라우드 구글 클라우드 플랫폼 GCP AWS 프라이스라인 디지털 트랜스포메이션 컨테이너 쿠버네티스 클라우드 네이티브 개발자 개발자 생산성 애널리틱스 머신러닝 데이터 과학

2022.02.25

프라이스라인(Priceline)은 실시간 애널리틱스와 클라우드 네이티브 기술을 최대한 활용하기 위해 멀티클라우드 마이그레이션을 진행 중이다. 하지만 그 과정에서 문제가 없는 건 아니다. 미국에서 코로나19 확산이 수그러들자 여행 업계가 속도를 내고 있다. 온라인 여행 서비스 기업 ‘프라이스라인(Priceline)’의 클라우드 트랜스포메이션도 마찬가지다. 트래블로시티(Travelocity), 익스피디아(Expedia), 호퍼(Hopper) 등과 경쟁하는 이 회사는 구글 클라우드 플랫폼(GCP)을 중심으로 한 멀티클라우드 마이그레이션의 중간 단계를 지나가고 있다.    프라이스라인의 CTO 마틴 브로드벡은 “디지털 트랜스포메이션을 추진하고 있다. 올해 자사 제품 플랫폼을 구글 클라우드와 연동되는 쿠버네티스로 현대화하는 작업을 마무리할 예정이다”라고 말했다. 오픈소스 컨테이너 관리 시스템인 쿠버네티스는 (프라이스라인의) 하드웨어 및 소프트웨어 프로비저닝을 최소화할 수 있도록 효율적인 수평 확장을 제공한다. 이는 고객 트래픽에 대응하는 데 있어 엄청난 유연성을 필요로 하는 이 비즈니스의 중요한 요소라고 그는 설명했다.  브로드벡에 따르면 쿠버네티스를 통해 프라이스라인 개발자는 프로덕션 환경에서 기능을 테스트하고 배포할 수 있게 됐다. 하지만 클라우드 네이티브 방법론 및 기술로의 전환은 특히 개발자 생산성 극대화와 관련해 완전히 순조롭지는 않았다고 그는 전했다.  클라우드에서의 실시간 애널리틱스 프라이스라인 비즈니스의 핵심이라고 할 수 있는 독점적인 가격 책정 엔진은 실시간 데이터 인프라와 애널리틱스를 활용한다. 이를 위해 프라이스라인은 테라바이트 단위의 데이터를 몇 초 만에 분석할 수 있는 구글 빅쿼리(Google BigQuery)와 카프카(Kafka)를 쓴다. 아울러 데이터스택스(DataStax)의 고속 쿼리 엔진과 스타버스터(Startbust)의 데이터 메시용 실시간 애널리틱스 플랫폼도 사용한다.  클라우드에...

2022.02.25

‘에이스’ 데이터 과학자 되고 싶다면... 살펴볼 만한 자격증 12종

‘데이터 과학자’로 앞서 나가고 싶은가? 다음의 데이터 과학 자격증 중 하나를 취득하면 IT 분야의 가장 ‘핫’한 커리어에서 두각을 나타내는 데 도움이 될 것이다.  데이터 과학자는 IT에서 가장 ‘ 핫’한 직업이다. 기업들이 광범위한 데이터를 분석할 수 있는 데이터 전문가를 확보하려고 열심이기 때문이다. 수익성 있는 이 분야에 뛰어들고 싶거나, 경쟁자들 사이에서 돋보이고 싶다면 데이터 과학 자격증을 취득하는 게 좋다.  데이터 과학 자격증 취득은 희망하는 산업에서 찾기 힘든 스킬을 연마할 수 있다는 점에서 경쟁력을 갖추기에 좋은 방법이다. 아울러 보유하고 있는 데이터 과학 노하우를 입증할 수 있는 방법이기도 하다. 대학에서 자격증을 취득하거나, 경력을 쌓고 싶거나, 특정 벤더와 관련된 스킬을 연마하거나, 데이터 분석 지식을 입증하고 싶을 때 도움이 될 자격증 12종을 알파벳 순서로 정리했다.    공인 애널리스트 프로페셔널(Certified Analytics Professional; CAP) CAP는 벤더 중립적인 자격증이며, ‘복잡한 데이터를 가치 있는 인사이트와 액션으로 전환하는’ 역량을 검증한다. 기업들이 데이터를 이해하고, 논리적인 결론을 도출하며, 이러한 데이터 포인트가 중요한 이유를 주요 이해관계자에게 설명할 수 있는 데이터 과학자를 원하기 때문이다. 특정 기준을 충족해야 CAP 또는 어소시에이트 레벨의 aCAP 시험에 응시할 수 있다. 관련 분야의 석사 학위가 있다면 관련 경력 3년, 관련 분야의 학사 학위가 있다면 관련 경력 5년, 분석 관련 학위가 없다면 7년의 경력이 필요하다. aCAP 시험은 석사 학위 및 3년 미만의 데이터 또는 분석 관련 경력이 필요하다. • 비용: CAP 시험의 경우 INFORMS 회원은 495달러, 비회원은 695달러다. aCAP 시험의 경우 INFORMS 회원은 200달러, 비회원은 300달러다.  • 위치: 지정된 시험 센터에서 직접 • 유효 기간: ...

데이터 과학 빅데이터 자격증 인증

2022.02.22

‘데이터 과학자’로 앞서 나가고 싶은가? 다음의 데이터 과학 자격증 중 하나를 취득하면 IT 분야의 가장 ‘핫’한 커리어에서 두각을 나타내는 데 도움이 될 것이다.  데이터 과학자는 IT에서 가장 ‘ 핫’한 직업이다. 기업들이 광범위한 데이터를 분석할 수 있는 데이터 전문가를 확보하려고 열심이기 때문이다. 수익성 있는 이 분야에 뛰어들고 싶거나, 경쟁자들 사이에서 돋보이고 싶다면 데이터 과학 자격증을 취득하는 게 좋다.  데이터 과학 자격증 취득은 희망하는 산업에서 찾기 힘든 스킬을 연마할 수 있다는 점에서 경쟁력을 갖추기에 좋은 방법이다. 아울러 보유하고 있는 데이터 과학 노하우를 입증할 수 있는 방법이기도 하다. 대학에서 자격증을 취득하거나, 경력을 쌓고 싶거나, 특정 벤더와 관련된 스킬을 연마하거나, 데이터 분석 지식을 입증하고 싶을 때 도움이 될 자격증 12종을 알파벳 순서로 정리했다.    공인 애널리스트 프로페셔널(Certified Analytics Professional; CAP) CAP는 벤더 중립적인 자격증이며, ‘복잡한 데이터를 가치 있는 인사이트와 액션으로 전환하는’ 역량을 검증한다. 기업들이 데이터를 이해하고, 논리적인 결론을 도출하며, 이러한 데이터 포인트가 중요한 이유를 주요 이해관계자에게 설명할 수 있는 데이터 과학자를 원하기 때문이다. 특정 기준을 충족해야 CAP 또는 어소시에이트 레벨의 aCAP 시험에 응시할 수 있다. 관련 분야의 석사 학위가 있다면 관련 경력 3년, 관련 분야의 학사 학위가 있다면 관련 경력 5년, 분석 관련 학위가 없다면 7년의 경력이 필요하다. aCAP 시험은 석사 학위 및 3년 미만의 데이터 또는 분석 관련 경력이 필요하다. • 비용: CAP 시험의 경우 INFORMS 회원은 495달러, 비회원은 695달러다. aCAP 시험의 경우 INFORMS 회원은 200달러, 비회원은 300달러다.  • 위치: 지정된 시험 센터에서 직접 • 유효 기간: ...

2022.02.22

애널리틱스 전초기지, 디즈니의 ‘데이터 클린룸’ 살펴보기

월트 디즈니 컴퍼니(Walt Disney Co.) 엔터테인먼트 및 스포츠 비즈니스 부문의 광고 판매와 통합 마케팅을 담당하는 ‘디즈니 광고 판매(Disney Advertising Sales; 이하 디즈니 AS)’는 사용자 프라이버시를 보호하면서 광고주에게 방대한 양의 시청자 데이터를 제공하기 위해 데이터 거버넌스에 ‘데이터 클린룸’ 접근 방식을 취하고 있다. 아울러 고객들이(광고주) 광고 메시지에 적합한 사용자를 찾을 수 있도록 다년간 데이터 및 애널리틱스 분야에서 새로운 영역을 개척하고 있다.   디즈니플러스(월트 디즈니의 스트리밍 서비스)의 가히 폭발적인 성장은 엄청난 양의 데이터를 추가했다. 현재 디즈니 AS는 이 데이터를 기반으로 구축한 1,000개 이상의 사용자 세그먼트를 광고주에 제공하고 있다. 하지만 큰 힘에는 큰 책임이 따르는 법이다. 다시 말해, 디즈니는 사용자 데이터와 프라이버시를 안전하게 보호하기 위해 새로운 데이터 거버넌스 접근 방식을 찾아야 했다. 지난 2021년 10월 디즈니 AS는 하부(Habu), 인포섬(InfoSum), 스노우플레이크(Snowflake) 등과 함께 구축한 새로운 클린룸 데이터 솔루션을 공개했다. 회사에 따르면 데이터 클린룸은 파트너가 공동 분석을 위해 정의된 규제 하에 데이터를 한데 모으는 장소다. 디즈니 AS의 시청자 모델링 및 데이터 과학 담당 부사장 다나 맥그로는 이러한 디즈니와 고객과의 관계는 디즈니가 데이터로 하는 모든 일에 등대 역할을 한다고 말했다. 그는 “고객과 관계를 맺는 방식(예: 데이터 클린룸) 그리고 여기서 생성되는 콘텐츠가 (디즈니의) 광고 오퍼링을 매력적으로 만드는 이유”라면서, “데이터, 데이터 사용, 데이터 거버넌스를 고려할 때 ‘이것이 고객 경험을 향상시키는지가 중요하다”라고 설명했다. 안전하게 데이터를 공유할 수 있는 ‘데이터 클린룸’  맥그로는 “브랜드가 디즈니와 데이터를 전혀 교환하지 않고 ▲시청자 그리고 ▲디즈니를 통해 광고하고 싶은 대상에 관한 인사...

데이터 애널리틱스 데이터 과학 디지털 트랜스포메이션 디즈니 광고 마케팅 프라이버시 데이터 클린룸 스노우플레이크

2022.02.16

월트 디즈니 컴퍼니(Walt Disney Co.) 엔터테인먼트 및 스포츠 비즈니스 부문의 광고 판매와 통합 마케팅을 담당하는 ‘디즈니 광고 판매(Disney Advertising Sales; 이하 디즈니 AS)’는 사용자 프라이버시를 보호하면서 광고주에게 방대한 양의 시청자 데이터를 제공하기 위해 데이터 거버넌스에 ‘데이터 클린룸’ 접근 방식을 취하고 있다. 아울러 고객들이(광고주) 광고 메시지에 적합한 사용자를 찾을 수 있도록 다년간 데이터 및 애널리틱스 분야에서 새로운 영역을 개척하고 있다.   디즈니플러스(월트 디즈니의 스트리밍 서비스)의 가히 폭발적인 성장은 엄청난 양의 데이터를 추가했다. 현재 디즈니 AS는 이 데이터를 기반으로 구축한 1,000개 이상의 사용자 세그먼트를 광고주에 제공하고 있다. 하지만 큰 힘에는 큰 책임이 따르는 법이다. 다시 말해, 디즈니는 사용자 데이터와 프라이버시를 안전하게 보호하기 위해 새로운 데이터 거버넌스 접근 방식을 찾아야 했다. 지난 2021년 10월 디즈니 AS는 하부(Habu), 인포섬(InfoSum), 스노우플레이크(Snowflake) 등과 함께 구축한 새로운 클린룸 데이터 솔루션을 공개했다. 회사에 따르면 데이터 클린룸은 파트너가 공동 분석을 위해 정의된 규제 하에 데이터를 한데 모으는 장소다. 디즈니 AS의 시청자 모델링 및 데이터 과학 담당 부사장 다나 맥그로는 이러한 디즈니와 고객과의 관계는 디즈니가 데이터로 하는 모든 일에 등대 역할을 한다고 말했다. 그는 “고객과 관계를 맺는 방식(예: 데이터 클린룸) 그리고 여기서 생성되는 콘텐츠가 (디즈니의) 광고 오퍼링을 매력적으로 만드는 이유”라면서, “데이터, 데이터 사용, 데이터 거버넌스를 고려할 때 ‘이것이 고객 경험을 향상시키는지가 중요하다”라고 설명했다. 안전하게 데이터를 공유할 수 있는 ‘데이터 클린룸’  맥그로는 “브랜드가 디즈니와 데이터를 전혀 교환하지 않고 ▲시청자 그리고 ▲디즈니를 통해 광고하고 싶은 대상에 관한 인사...

2022.02.16

“전 세계 금융 기업 78%, AI 활용 위해 가속 컴퓨팅 사용” 엔비디아

엔비디아가 ‘금융 서비스의 AI 활용 현황’에 관한 설문조사를 발표했다. 회사에 따르면 이번 조사는 자본 시장, 소매 금융, 투자 기업에서 AI 도입의 증가세를 보여준다.    엔비디아의 조사에 의하면 AI는 월스트리트에서 거래하는 가장 큰 기업부터 사기 방지 기능을 제공하는 은행, 소비자에게 가장 적합한 상품을 추천하는 핀테크에 이르기까지 금융 서비스 산업 전반에 걸쳐 혁신을 주도하고 있는 것으로 나타났다. 금융 서비스 전문가 중 78%가 머신 러닝, 딥 러닝 또는 고성능 컴퓨팅을 통해 AI 지원 애플리케이션을 제공하기 위해 가속 컴퓨팅을 사용한다고 응답했다. 엔비디아의 ‘금융 서비스의 AI 활용 현황’ 보고서의 설문 결과는 금융 서비스에 종사하는 500명 이상의 경영진, 개발자, 데이터 과학자, 엔지니어 및 IT 팀의 응답을 바탕으로 작성됐다. 지난 2020년 전 세계적으로 700억 건 이상의 실시간 결제 거래가 처리된 상황에서, 금융기관들은 사기를 방지하고 비용을 절감할 수 있는 강력한 시스템이 필요하다. 이에 따라 결제·거래 관련 사기 부문이 전체 응답자의 AI 활용 사례 중 31%로 1위를 차지했고, 대화형 AI는 28%, 알고리즘 거래는 27%로 뒤를 이었다. AI 활용 사례에 투자하는 금융 기관의 비율은 해마다 급격히 증가한다. 보험 관련 AI의 보급률은 지난 2021년 3%에서 올해 12%로 4배 증가했다. 대화형 AI는 8%에서 28%로 전년 대비 3.5배 증가했다. 한편, 사기 탐지, 고객 분석(know-your-customer) 및 자금 세탁 방지를 위한 AI 적용 애플리케이션은 모두 이번 조사에서 최소 300%의 성장을 보였다. 현재 13건의 활용 사례 중 9건은 15% 이상의 금융서비스 회사가 활용하고 있지만, 지난해 보고서에서는 이를 넘어선 활용 사례는 단 한 건도 없었다. 금융서비스 전문가들은 AI가 보다 정확한 모델을 산출하고 경쟁 우위를 창출하며 고객 경험을 개선하는 주요 이점을 강조했다. 전반적으로 ...

엔비디아 인공지능 가속 컴퓨팅 대화형 AI 알고리즘 거래 사기 탐지 고객 분석 AI 애플리케이션 데이터 과학 설명 가능성

2022.01.28

엔비디아가 ‘금융 서비스의 AI 활용 현황’에 관한 설문조사를 발표했다. 회사에 따르면 이번 조사는 자본 시장, 소매 금융, 투자 기업에서 AI 도입의 증가세를 보여준다.    엔비디아의 조사에 의하면 AI는 월스트리트에서 거래하는 가장 큰 기업부터 사기 방지 기능을 제공하는 은행, 소비자에게 가장 적합한 상품을 추천하는 핀테크에 이르기까지 금융 서비스 산업 전반에 걸쳐 혁신을 주도하고 있는 것으로 나타났다. 금융 서비스 전문가 중 78%가 머신 러닝, 딥 러닝 또는 고성능 컴퓨팅을 통해 AI 지원 애플리케이션을 제공하기 위해 가속 컴퓨팅을 사용한다고 응답했다. 엔비디아의 ‘금융 서비스의 AI 활용 현황’ 보고서의 설문 결과는 금융 서비스에 종사하는 500명 이상의 경영진, 개발자, 데이터 과학자, 엔지니어 및 IT 팀의 응답을 바탕으로 작성됐다. 지난 2020년 전 세계적으로 700억 건 이상의 실시간 결제 거래가 처리된 상황에서, 금융기관들은 사기를 방지하고 비용을 절감할 수 있는 강력한 시스템이 필요하다. 이에 따라 결제·거래 관련 사기 부문이 전체 응답자의 AI 활용 사례 중 31%로 1위를 차지했고, 대화형 AI는 28%, 알고리즘 거래는 27%로 뒤를 이었다. AI 활용 사례에 투자하는 금융 기관의 비율은 해마다 급격히 증가한다. 보험 관련 AI의 보급률은 지난 2021년 3%에서 올해 12%로 4배 증가했다. 대화형 AI는 8%에서 28%로 전년 대비 3.5배 증가했다. 한편, 사기 탐지, 고객 분석(know-your-customer) 및 자금 세탁 방지를 위한 AI 적용 애플리케이션은 모두 이번 조사에서 최소 300%의 성장을 보였다. 현재 13건의 활용 사례 중 9건은 15% 이상의 금융서비스 회사가 활용하고 있지만, 지난해 보고서에서는 이를 넘어선 활용 사례는 단 한 건도 없었다. 금융서비스 전문가들은 AI가 보다 정확한 모델을 산출하고 경쟁 우위를 창출하며 고객 경험을 개선하는 주요 이점을 강조했다. 전반적으로 ...

2022.01.28

AI도 과하면 독, ‘딱 맞는 해법’은 따로 있다

AI 프로젝트를 성공시키려면 비즈니스 가치, 학습용 데이터, 문화적 준비가 필수다. 이 3가지가 모두 없다면 기존 솔루션이 더 적합할 수도 있다. 인공지능(AI) 도입이 증가하고 있다. 최근 발표된 맥킨지의 설문조사 결과에 따르면 55%의 기업이 적어도 1개 부서에서 인공지능을 사용하고 있으며, 27%는 이자 및 세전 수익의 최소 5%를 AI를 통해 비용 절감의 형태로 얻고 있는 것으로 나타났다. AI가 (관련된) 거의 모든 산업을 극적으로 변화시킬 것이기 때문에 벤더와 기업들이 가능한 모든 곳에 AI를 배포할 기회를 찾고 있다는 건 놀라운 일은 아니다. 하지만 모든 프로젝트가 AI의 이점을 누릴 수 있는 건 아니며, 적절하지 않은 곳에 AI를 도입하면 시간과 비용을 낭비할 뿐만 아니라 직원, 고객, 기업 리더가 고배를 마실 수 있다. 어떤 프로젝트가 AI에 적합한지를 판단하는 핵심 요소는 ▲비즈니스 가치, ▲학습용 데이터의 가용성, ▲변화에 따른 문화적 준비 수준이다. 인공지능 이니셔티브가 매몰 비용이 되기 전에, 제안된 AI 프로젝트에 이러한 요소가 부합하는지 확인하는 방법을 살펴본다.   가장 간단한 솔루션부터 시작하라 전 세계 90여 개국에 1만 8,000개 이상의 매장을 보유하고 있는 피자 체인점 도미노의 데이터 과학 및 AI 부문 관리자 잭 프라고소는 특히 데이터 과학자가 AI 우선 접근법을 선호한다고 말했다. 하지만 모든 곳에 AI를 적용할 순 없다고 그는 지적했다.  전통적인 산업이지만 도미노는 변화를 추진해왔다. 특히 팬데믹 기간에는 더욱더 그랬다. 현재 고객들은 13가지 디지털 방식으로 피자를 주문할 수 있으며, 2020년 도미노 매출의 70% 이상은 디지털 주문에서 나왔다. 이는 AI의 가능성을 입증할 수 있는 많은 기회를 열어줬다. 프라고소는 “도미노가 AI를 도입할 때의 핵심은 간단한 접근방식을 취하는 것이었다”라며, “단순한 솔루션이 더 빠르게 실행되고 더 나은 성과를 보여주기 때문에 이를 비즈니스 파트너...

인공지능 머신러닝 디지털 트랜스포메이션 도미노 피자 데이터세트 ML옵스 질로우 NLP 데이터 과학

2022.01.25

AI 프로젝트를 성공시키려면 비즈니스 가치, 학습용 데이터, 문화적 준비가 필수다. 이 3가지가 모두 없다면 기존 솔루션이 더 적합할 수도 있다. 인공지능(AI) 도입이 증가하고 있다. 최근 발표된 맥킨지의 설문조사 결과에 따르면 55%의 기업이 적어도 1개 부서에서 인공지능을 사용하고 있으며, 27%는 이자 및 세전 수익의 최소 5%를 AI를 통해 비용 절감의 형태로 얻고 있는 것으로 나타났다. AI가 (관련된) 거의 모든 산업을 극적으로 변화시킬 것이기 때문에 벤더와 기업들이 가능한 모든 곳에 AI를 배포할 기회를 찾고 있다는 건 놀라운 일은 아니다. 하지만 모든 프로젝트가 AI의 이점을 누릴 수 있는 건 아니며, 적절하지 않은 곳에 AI를 도입하면 시간과 비용을 낭비할 뿐만 아니라 직원, 고객, 기업 리더가 고배를 마실 수 있다. 어떤 프로젝트가 AI에 적합한지를 판단하는 핵심 요소는 ▲비즈니스 가치, ▲학습용 데이터의 가용성, ▲변화에 따른 문화적 준비 수준이다. 인공지능 이니셔티브가 매몰 비용이 되기 전에, 제안된 AI 프로젝트에 이러한 요소가 부합하는지 확인하는 방법을 살펴본다.   가장 간단한 솔루션부터 시작하라 전 세계 90여 개국에 1만 8,000개 이상의 매장을 보유하고 있는 피자 체인점 도미노의 데이터 과학 및 AI 부문 관리자 잭 프라고소는 특히 데이터 과학자가 AI 우선 접근법을 선호한다고 말했다. 하지만 모든 곳에 AI를 적용할 순 없다고 그는 지적했다.  전통적인 산업이지만 도미노는 변화를 추진해왔다. 특히 팬데믹 기간에는 더욱더 그랬다. 현재 고객들은 13가지 디지털 방식으로 피자를 주문할 수 있으며, 2020년 도미노 매출의 70% 이상은 디지털 주문에서 나왔다. 이는 AI의 가능성을 입증할 수 있는 많은 기회를 열어줬다. 프라고소는 “도미노가 AI를 도입할 때의 핵심은 간단한 접근방식을 취하는 것이었다”라며, “단순한 솔루션이 더 빠르게 실행되고 더 나은 성과를 보여주기 때문에 이를 비즈니스 파트너...

2022.01.25

2022년 IT 지출처··· ‘핫한’ 7가지 ‘지는’ 4가지

IT 리더들이 ‘기술’을 활용하여 혁신과 비즈니스 트랜스포메이션에 박차를 가할 방안을 모색하고 있다. 그렇다면 투자가 늘어나고 있는 기술은 무엇인지, 반면에 약화되거나 축소되고 있는 기술은 무엇인지 살펴본다.  팬데믹 기간 동안 가속화된 디지털 트랜스포메이션 물결을 타고 올해에도 기업들은 혁신을 촉진하고 비즈니스 운영을 트랜스포메이션하고자 기술을 적극적으로 활용할 전망이다. 이를 위해서는 기술 투자가 필요하다. 이를 아는 기업들은 새로운 기술 및 기존 기술 예산을 늘리고 있다. 액센츄어에 따르면 전체 디지털 지출은 2023년까지 총 IT 지출의 55%를 차지할 것으로 예상되며, 지난 2021년보다 약 10% 증가하는 수준이다.    액센츄어의 수석 전무이사 애슐리 스카이름은 이러한 지출이 4가지 핵심 영역에 집중될 것이라고 밝혔다. 첫 번째는 시장 출시 속도가 중요한 시장(예: AI, 블록체인, AR/VR 등)에서 가치를 입증하기 위해 새로운 사용 사례를 빠르게 시험하고 프로토타이핑하면서 기업들이 ‘재창조하고 혁신하는’ 영역이다. 두 번째 영역은 데이터 및 애널리틱스용 플랫폼 등 ‘새로운 역량 또는 수익원을 창출하는 혁신적인 투자’를 통해 확장하고 차별화하면서 비즈니스를 성장시키는 것이다. 세 번째는 ERP/CRM, 품질, 공급 계획 시스템 등 경쟁력 있는 비즈니스 역량 또는 프로세스 디지털화를 통해 가치사슬을 디지털화하는 것이다. 마지막은 비즈니스를 운영하고, 데이터센터 및 네트워크 등에서 보안 및 컴플라이언스를 유지하는 데 필요한 기술 역량이다.  여기서는 2022년 CIO와 IT 리더들이 투자하게 될 ‘뜨거운(Hot)’ IT 기술 7가지와 ‘차가운(Cold)’ IT 기술 4가지를 정리했다.   Hot: 클라우드 네이티브 관리형 서비스 KPMG의 수석 고문 마크 생크는 클라우드 네이티브 관리형 서비스를 활용하기 위한 투자가 이뤄질 것이라고 말했다. 그는 “예전엔 기업들이 클라우드 투자로 인한 벤더 락...

IT 투자 IT 리더 CIO IT 리더십 디지털 트랜스포메이션 클라우드 네이티브 사물인터넷 데이터 레이크 데이터 웨어하우스 프라이빗 클라우드 직원 인게이지먼트 애널리틱스 데이터 과학 고객 경험 보안

2022.01.10

IT 리더들이 ‘기술’을 활용하여 혁신과 비즈니스 트랜스포메이션에 박차를 가할 방안을 모색하고 있다. 그렇다면 투자가 늘어나고 있는 기술은 무엇인지, 반면에 약화되거나 축소되고 있는 기술은 무엇인지 살펴본다.  팬데믹 기간 동안 가속화된 디지털 트랜스포메이션 물결을 타고 올해에도 기업들은 혁신을 촉진하고 비즈니스 운영을 트랜스포메이션하고자 기술을 적극적으로 활용할 전망이다. 이를 위해서는 기술 투자가 필요하다. 이를 아는 기업들은 새로운 기술 및 기존 기술 예산을 늘리고 있다. 액센츄어에 따르면 전체 디지털 지출은 2023년까지 총 IT 지출의 55%를 차지할 것으로 예상되며, 지난 2021년보다 약 10% 증가하는 수준이다.    액센츄어의 수석 전무이사 애슐리 스카이름은 이러한 지출이 4가지 핵심 영역에 집중될 것이라고 밝혔다. 첫 번째는 시장 출시 속도가 중요한 시장(예: AI, 블록체인, AR/VR 등)에서 가치를 입증하기 위해 새로운 사용 사례를 빠르게 시험하고 프로토타이핑하면서 기업들이 ‘재창조하고 혁신하는’ 영역이다. 두 번째 영역은 데이터 및 애널리틱스용 플랫폼 등 ‘새로운 역량 또는 수익원을 창출하는 혁신적인 투자’를 통해 확장하고 차별화하면서 비즈니스를 성장시키는 것이다. 세 번째는 ERP/CRM, 품질, 공급 계획 시스템 등 경쟁력 있는 비즈니스 역량 또는 프로세스 디지털화를 통해 가치사슬을 디지털화하는 것이다. 마지막은 비즈니스를 운영하고, 데이터센터 및 네트워크 등에서 보안 및 컴플라이언스를 유지하는 데 필요한 기술 역량이다.  여기서는 2022년 CIO와 IT 리더들이 투자하게 될 ‘뜨거운(Hot)’ IT 기술 7가지와 ‘차가운(Cold)’ IT 기술 4가지를 정리했다.   Hot: 클라우드 네이티브 관리형 서비스 KPMG의 수석 고문 마크 생크는 클라우드 네이티브 관리형 서비스를 활용하기 위한 투자가 이뤄질 것이라고 말했다. 그는 “예전엔 기업들이 클라우드 투자로 인한 벤더 락...

2022.01.10

“데이터 파이프라인의 번거로움 해소”··· 구글, ‘예측 프레임워크’ 공개

구글의 ‘예측 프레임워크(Prediction Framework)’는 클라우드 펑션(Cloud Functions)부터 펍섭(Pub/Sub), 버텍스 오토ML(Vertex AutoML), 빅쿼리(BigQuery)까지 구글 클라우드 플랫폼 서비스를 결합하여 데이터 과학 예측 프로젝트 구현을 단순화해 시간을 절약할 수 있도록 지원한다.    지난 2021년 12월 29일(현지 시각) 공개된 블로그 게시물에 따르면 예측 프레임워크는 예측 솔루션의 기반과 커스터마이제이션을 제공하기 위해 설계됐다. 또한 구글 클라우드 플랫폼에서 호스팅할 수 있는 이 프레임워크는 데이터 추출, 데이터 준비, 필터링, 예측, 사후 처리 등 예측 프로젝트와 관련된 모든 단계를 보편화하고자 한다.  프레임워크 코드는 깃허브에서 확인할 수 있다. 예측 프레임워크는 데이터 처리에 구글 클라우드 펑션, 모델 호스팅에 버텍스 오토ML, 예측 최종 저장에 빅쿼리를 사용한다. 구글 클라우드 파이어스토어, 펍섭, 스케줄러도 파이프라인에서 활용된다. 사용자는 클라우드 프로젝트, 데이터 소스, (예측을 수행할) ML 모델, 조절 시스템용 스케줄러에 관한 환경 변수가 포함된 구성 파일을 준비해야 한다.  구글은 해당 프레임워크의 유용성을 언급하면서, 예측된 평생 가치를 활용해 고부가가치 고객을 확보하거나 잠재고객을 생성하는 등 모든 마케팅 시나리오에는 퍼스트파티 데이터 분석, 데이터 예측, 마케팅 플랫폼(예: 구글 애즈(Google Ads) 등)에서의 결과 활용이 필요하다고 설명했다.  아울러 이러한 마케팅 플랫폼을 정기적으로 제공하려면 보고서 중심의 비용 절감형 ETL 및 예측 파이프라인이 필요하며, 예측 프레임워크는 예측 프로세스의 백본 요소를 제공해 데이터 예측 프로젝트를 구현하고 가속화하는 데 도움을 준다고 회사 측은 덧붙였다. ciokr@idg.co.kr

구글 예측 애널리틱스 데이터 과학 구글 클라우드 플랫폼 마케팅

2022.01.06

구글의 ‘예측 프레임워크(Prediction Framework)’는 클라우드 펑션(Cloud Functions)부터 펍섭(Pub/Sub), 버텍스 오토ML(Vertex AutoML), 빅쿼리(BigQuery)까지 구글 클라우드 플랫폼 서비스를 결합하여 데이터 과학 예측 프로젝트 구현을 단순화해 시간을 절약할 수 있도록 지원한다.    지난 2021년 12월 29일(현지 시각) 공개된 블로그 게시물에 따르면 예측 프레임워크는 예측 솔루션의 기반과 커스터마이제이션을 제공하기 위해 설계됐다. 또한 구글 클라우드 플랫폼에서 호스팅할 수 있는 이 프레임워크는 데이터 추출, 데이터 준비, 필터링, 예측, 사후 처리 등 예측 프로젝트와 관련된 모든 단계를 보편화하고자 한다.  프레임워크 코드는 깃허브에서 확인할 수 있다. 예측 프레임워크는 데이터 처리에 구글 클라우드 펑션, 모델 호스팅에 버텍스 오토ML, 예측 최종 저장에 빅쿼리를 사용한다. 구글 클라우드 파이어스토어, 펍섭, 스케줄러도 파이프라인에서 활용된다. 사용자는 클라우드 프로젝트, 데이터 소스, (예측을 수행할) ML 모델, 조절 시스템용 스케줄러에 관한 환경 변수가 포함된 구성 파일을 준비해야 한다.  구글은 해당 프레임워크의 유용성을 언급하면서, 예측된 평생 가치를 활용해 고부가가치 고객을 확보하거나 잠재고객을 생성하는 등 모든 마케팅 시나리오에는 퍼스트파티 데이터 분석, 데이터 예측, 마케팅 플랫폼(예: 구글 애즈(Google Ads) 등)에서의 결과 활용이 필요하다고 설명했다.  아울러 이러한 마케팅 플랫폼을 정기적으로 제공하려면 보고서 중심의 비용 절감형 ETL 및 예측 파이프라인이 필요하며, 예측 프레임워크는 예측 프로세스의 백본 요소를 제공해 데이터 예측 프로젝트를 구현하고 가속화하는 데 도움을 준다고 회사 측은 덧붙였다. ciokr@idg.co.kr

2022.01.06

IDG 설문조사

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.5.0.8