Offcanvas

ML������

기고ㅣ파일럿에서 프로덕션까지, ‘AI 프로젝트’ 시작하고 성공하는 법

성과를 개선할 수 있는, 즉 비즈니스에 영향을 미치는 영역에서 성공을 거두려는 CIO라면 데이터 과학, ML, AI 프로젝트를 검토해야 한다.  인도의 AI 프로젝트를 조사한 최근의 IDC 보고서에 따르면 AI 프로젝트의 30~49%가 기업의 약 3분의 1에서 실패했다. 또 딜로이트 보고서에 의하면 전체 응답자의 50%가 (소속 기업의) AI 성과를 ‘아직 시작하는 또는 저조한 상태’라고 지적했다. 한편 전체 응답자의 94%는 AI가 앞으로 5년 동안의 (비즈니스) 성공에 매우 중요하다고 말했다. 경영진은 AI를 통해 차별화할 기회를 보고 있으며, 성공적인 결과를 제공할 리더도 찾고 있는 것으로 조사됐다.    ML과 AI는 상대적으로 여전히 새로운 영역이며, (따라서) 리더들은 지속적인 학습과 성숙도 향상을 추진해야 한다. 여기서 CIO, CDO 및 수석 과학자가 파일럿부터 프로덕션까지 AI 프로젝트 진행을 개선하는 데 중요한 역할을 할 수 있다.  데이터 과학팀이 성공을 위한 준비가 돼 있는가?  데이터 과학팀을 위한 베스트 프랙티스 개발 플레이북은 ML 모델을 구축하고 테스트하는 개발 프로세스와 기술을 다룬다. 모델 구축은 쉬운 일이 아니며, 데이터 과학자는 데이터 정제 및 태그 지정, 알고리즘 선택, 모델 구성, 인프라 설정 및 결과 검증에 어려움을 겪고 있다.  AI 딜리버리 성능을 향상하려는 리더는 우선 다음의 첫 번째 질문을 해결해야 한다. 데이터 과학자가 성공을 위해 준비됐는가? 의미 있는 비즈니스 결과를 도출할 문제를 해결하고 있는가? 머신러닝 플랫폼(예: 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)), 인프라 액세스, 데이터 과학 관행을 개선하기 위한 지속적인 교육 시간이 있는가? CIO와 CDO가 모델옵스(ModelOps)를 주도하고 라이프사이클을 감독해야 한다 데이터 과학팀이 모델 개발에 어려움을 겪는다면 리더는 이러한 문제를 검토하고 해결할 수 있어야 ...

AI 프로젝트 파일럿 프로덕션 CIO CDO 데이터 과학 모델옵스 ML옵스

2022.11.08

성과를 개선할 수 있는, 즉 비즈니스에 영향을 미치는 영역에서 성공을 거두려는 CIO라면 데이터 과학, ML, AI 프로젝트를 검토해야 한다.  인도의 AI 프로젝트를 조사한 최근의 IDC 보고서에 따르면 AI 프로젝트의 30~49%가 기업의 약 3분의 1에서 실패했다. 또 딜로이트 보고서에 의하면 전체 응답자의 50%가 (소속 기업의) AI 성과를 ‘아직 시작하는 또는 저조한 상태’라고 지적했다. 한편 전체 응답자의 94%는 AI가 앞으로 5년 동안의 (비즈니스) 성공에 매우 중요하다고 말했다. 경영진은 AI를 통해 차별화할 기회를 보고 있으며, 성공적인 결과를 제공할 리더도 찾고 있는 것으로 조사됐다.    ML과 AI는 상대적으로 여전히 새로운 영역이며, (따라서) 리더들은 지속적인 학습과 성숙도 향상을 추진해야 한다. 여기서 CIO, CDO 및 수석 과학자가 파일럿부터 프로덕션까지 AI 프로젝트 진행을 개선하는 데 중요한 역할을 할 수 있다.  데이터 과학팀이 성공을 위한 준비가 돼 있는가?  데이터 과학팀을 위한 베스트 프랙티스 개발 플레이북은 ML 모델을 구축하고 테스트하는 개발 프로세스와 기술을 다룬다. 모델 구축은 쉬운 일이 아니며, 데이터 과학자는 데이터 정제 및 태그 지정, 알고리즘 선택, 모델 구성, 인프라 설정 및 결과 검증에 어려움을 겪고 있다.  AI 딜리버리 성능을 향상하려는 리더는 우선 다음의 첫 번째 질문을 해결해야 한다. 데이터 과학자가 성공을 위해 준비됐는가? 의미 있는 비즈니스 결과를 도출할 문제를 해결하고 있는가? 머신러닝 플랫폼(예: 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)), 인프라 액세스, 데이터 과학 관행을 개선하기 위한 지속적인 교육 시간이 있는가? CIO와 CDO가 모델옵스(ModelOps)를 주도하고 라이프사이클을 감독해야 한다 데이터 과학팀이 모델 개발에 어려움을 겪는다면 리더는 이러한 문제를 검토하고 해결할 수 있어야 ...

2022.11.08

데이터 과학 생산성 Up! ‘모델옵스’의 5가지 기능 살펴보기

‘2022 모델옵스 현황(State of Modelops 2022)’ 보고서에 따르면 대기업의 51%가 초기 단계의 인공지능 파일럿 또는 실험을 했지만 아직 프로덕션 환경에는 투입하지 않은 것으로 나타났다. 38%만이 AI 투자수익률(ROI)을 이야기할 수 있다고 말했으며, 43%는 적시에 문제를 찾고 해결하는 데 비효율적이라고 답했다.  이는 프로덕션 환경에서 ML 모델을 개발, 제공, 관리하는 ‘생산성’을 향상시킬 방법의 필요성을 강조한다.    ML옵스 또는 모델옵스? 둘 다 필요할 수 있다 알터릭스(Alteryx)부터 AWS 세이지메이커(AWS SageMaker), 다타이쿠(Dataiku), 데이터로봇(DataRobot), 구글 버텍스 AI(Google Vertex AI), 나임(KNIME), 마이크로소프트 애저 머신러닝(Microsoft Azure Machine Learning), SAS까지 오늘날 모델 개발을 위해 선택할 수 있는 애널리틱스 도구가 많다. 데이터 과학팀이 애널리틱스 도구를 통합하고, 실험하며, ML 모델을 배포할 수 있도록 지원하는 ML옵스 플랫폼도 있다.  레디AI(ReadyAI)의 총괄 관리자 겸 딜로이트 컨설팅(Deloitte Consulting)의 전무 로힛 탄돈은 대규모 AI 구축 및 배포에서 ML옵스의 역할을 다음과 같이 설명했다. “기업이 AI 개발 용량을 수십에서 수백 또는 수천 개의 ML 모델로 확장하려고 할 때, 데브옵스가 소프트웨어 개발에 가져온 것과 동일한 엔지니어링 및 운영 원칙의 이점을 누릴 수 있다. ML옵스는 수동적이고 비효율적인 워크플로우를 자동화하고 모델 구성 및 관리의 모든 단계를 간소화하는 데 유용하다.” 많은 ML옵스 플랫폼이 프로덕션 환경에서 배포 및 모니터링 모델을 지원하지만 주요 기능은 개발, 테스트, 프로세스 개선 과정에서 (데이터 과학자에게) 서비스를 제공하는 것이다.  모델옵스(Modelops) 플랫폼 및 프랙티스는 프로덕션 환경에...

데이터 과학 데이터 과학자 데브옵스 머신러닝 ML옵스 모델옵스 애널리틱스

2022.10.25

‘2022 모델옵스 현황(State of Modelops 2022)’ 보고서에 따르면 대기업의 51%가 초기 단계의 인공지능 파일럿 또는 실험을 했지만 아직 프로덕션 환경에는 투입하지 않은 것으로 나타났다. 38%만이 AI 투자수익률(ROI)을 이야기할 수 있다고 말했으며, 43%는 적시에 문제를 찾고 해결하는 데 비효율적이라고 답했다.  이는 프로덕션 환경에서 ML 모델을 개발, 제공, 관리하는 ‘생산성’을 향상시킬 방법의 필요성을 강조한다.    ML옵스 또는 모델옵스? 둘 다 필요할 수 있다 알터릭스(Alteryx)부터 AWS 세이지메이커(AWS SageMaker), 다타이쿠(Dataiku), 데이터로봇(DataRobot), 구글 버텍스 AI(Google Vertex AI), 나임(KNIME), 마이크로소프트 애저 머신러닝(Microsoft Azure Machine Learning), SAS까지 오늘날 모델 개발을 위해 선택할 수 있는 애널리틱스 도구가 많다. 데이터 과학팀이 애널리틱스 도구를 통합하고, 실험하며, ML 모델을 배포할 수 있도록 지원하는 ML옵스 플랫폼도 있다.  레디AI(ReadyAI)의 총괄 관리자 겸 딜로이트 컨설팅(Deloitte Consulting)의 전무 로힛 탄돈은 대규모 AI 구축 및 배포에서 ML옵스의 역할을 다음과 같이 설명했다. “기업이 AI 개발 용량을 수십에서 수백 또는 수천 개의 ML 모델로 확장하려고 할 때, 데브옵스가 소프트웨어 개발에 가져온 것과 동일한 엔지니어링 및 운영 원칙의 이점을 누릴 수 있다. ML옵스는 수동적이고 비효율적인 워크플로우를 자동화하고 모델 구성 및 관리의 모든 단계를 간소화하는 데 유용하다.” 많은 ML옵스 플랫폼이 프로덕션 환경에서 배포 및 모니터링 모델을 지원하지만 주요 기능은 개발, 테스트, 프로세스 개선 과정에서 (데이터 과학자에게) 서비스를 제공하는 것이다.  모델옵스(Modelops) 플랫폼 및 프랙티스는 프로덕션 환경에...

2022.10.25

인간의 직감을 추월하다··· 2022년 기업 분야 AI 동향 10가지

AI가 마침내 주류로 안착했다. 여러 업종에서 성공적인 개념 증명이 출현했으며, AI를 생산 현장 성공적으로 배치한 사례도 다수 등장했다. 일부 조직들은 기업 전반에 걸쳐 AI/ML 프로젝트를 적용해 파이프라인으로 완성하기도 했다.  이런 전반적인 성숙으로 인해 기업들이 AI의 전략적 가치를 보는 방식과 그 이점이 실현되기를 바라는 분야가 달라지고 있다. 현재 산업 전문가들이 진단하는 10가지 AI 기업 전략 트렌드를 살펴본다.   비즈니스 현장에 접근하는 AI 인공지능 초기에 프로젝트는 데이터 사이언티스트들만이 주도했었다. 데이터와 알고리즘이 있었고, 새로운 도구를 비즈니스 문제에 적용하는 수단을 이들이 선택했다. 때로는 성공하기도 했다. 지금 그 역학이 뒤집어지고 있다. 비즈니스 리더들은 몇몇 성공적인 프로젝트를 통해 배웠으며 AI가 어떤 도움이 될 수 있는지에 대해 좀더 자세히 깨달아가고 있다. 그 결과, 일선의 사업부들이 점차 AI 도입을 주도하고 있다. 맥킨지(McKinsey&Co.)의 퀀텀블랙(QuantumBlack) 글로벌 책임자 알렉스 싱글라는 “AI를 잘 하는 기업들은 현업 부분이 주도하고 있다”라고 말했다. 예를 들어, 허니웰(Honeywell)은 내부 운영에 AI를 사용하고 있으며 이를 고객용 제품과 서비스에 적용하고 있다고 해당 기업의 CDTO 쉐일라 조단은 “우리 또한 현업 부문과 긴밀한 관계를 맺고 있다. 우리는 가치 지향적이며, 고객을 위한 가치가 최우선적이다”라고 말했다. 기업 전 분야에 스며드는 AI 2년 전 조단이 허니웰에 입사했을 때, 첫 번째 대형 프로젝트는 데이터 웨어하우스 전략을 구현하여 모든 트랜잭션 데이터를 수집하는 것이었다. 그녀는 “이제 모든 부서, 모든 사업부에 디지털 의제가 있다”라고 말했다. 예를 들어, 허니웰은 모든 계약을 디지털화 했다. 그녀는 10만 건 이상의 디지털 계약를 통해 해당 기업이 거의 모든 기능 영역을 위한 AI 솔루션을 구축하는 데 도움이 되는 풍...

RPA 성숙곡선 ML옵스

2022.03.07

AI가 마침내 주류로 안착했다. 여러 업종에서 성공적인 개념 증명이 출현했으며, AI를 생산 현장 성공적으로 배치한 사례도 다수 등장했다. 일부 조직들은 기업 전반에 걸쳐 AI/ML 프로젝트를 적용해 파이프라인으로 완성하기도 했다.  이런 전반적인 성숙으로 인해 기업들이 AI의 전략적 가치를 보는 방식과 그 이점이 실현되기를 바라는 분야가 달라지고 있다. 현재 산업 전문가들이 진단하는 10가지 AI 기업 전략 트렌드를 살펴본다.   비즈니스 현장에 접근하는 AI 인공지능 초기에 프로젝트는 데이터 사이언티스트들만이 주도했었다. 데이터와 알고리즘이 있었고, 새로운 도구를 비즈니스 문제에 적용하는 수단을 이들이 선택했다. 때로는 성공하기도 했다. 지금 그 역학이 뒤집어지고 있다. 비즈니스 리더들은 몇몇 성공적인 프로젝트를 통해 배웠으며 AI가 어떤 도움이 될 수 있는지에 대해 좀더 자세히 깨달아가고 있다. 그 결과, 일선의 사업부들이 점차 AI 도입을 주도하고 있다. 맥킨지(McKinsey&Co.)의 퀀텀블랙(QuantumBlack) 글로벌 책임자 알렉스 싱글라는 “AI를 잘 하는 기업들은 현업 부분이 주도하고 있다”라고 말했다. 예를 들어, 허니웰(Honeywell)은 내부 운영에 AI를 사용하고 있으며 이를 고객용 제품과 서비스에 적용하고 있다고 해당 기업의 CDTO 쉐일라 조단은 “우리 또한 현업 부문과 긴밀한 관계를 맺고 있다. 우리는 가치 지향적이며, 고객을 위한 가치가 최우선적이다”라고 말했다. 기업 전 분야에 스며드는 AI 2년 전 조단이 허니웰에 입사했을 때, 첫 번째 대형 프로젝트는 데이터 웨어하우스 전략을 구현하여 모든 트랜잭션 데이터를 수집하는 것이었다. 그녀는 “이제 모든 부서, 모든 사업부에 디지털 의제가 있다”라고 말했다. 예를 들어, 허니웰은 모든 계약을 디지털화 했다. 그녀는 10만 건 이상의 디지털 계약를 통해 해당 기업이 거의 모든 기능 영역을 위한 AI 솔루션을 구축하는 데 도움이 되는 풍...

2022.03.07

‘노코드 AI’에서 미래를 보다··· 엑스페리언 데이터랩의 혁신 이야기

글로벌 신용정보평가사 ‘엑스페리언(Experian)’은 데이터를 원동력으로 하는 회사라는 사실에 자부심을 갖고 있다. 그리고 이러한 데이터 중심 활동의 선봉에는 ‘엑스페리언 데이터랩(Experian DataLabs)’이 있다. 이 사업부는 데이터로 비즈니스를 혁신할 기회를 모색하고 있다.  엑스페리언 데이터랩의 수석 부사장 겸 최고 데이터 과학자 케빈 첸은 “고객이 고수익을 얻을 기회를 포착하면 연구 자원을 투입하여 상품화 가능한 프로토타입을 개발한다”라고 말했다.  그에 따르면 데이터랩 팀은 자유롭게 실험하고 아이디어를 솔루션화하면 이를 실행할 사업부에 넘긴 다음 다시 새로운 것에 관심을 쏟는다. 첸은 “항상 새로운 아이디어를 시도해볼 수 있다. 이는 인재를 끌어들이는 하나의 매력 포인트다”라고 언급했다.    ‘노코드 AI’의 이점 엑스페리언 데이터랩은 솔루션이 비즈니스를 변혁할 수 있는 문제를 파악하는 데 중점을 두고 있으며, 첸은 이를 ‘영향력이 큰 문제(high-impact problems)’라고 부른다.  그는 소비자 신용부터 기업 신용, 온/오프라인 마케팅, 의료 정보 기술까지 여러 엑스페리언 사업부의 데이터를 연결했던 프로젝트를 예로 들었다. “과거 엑스페리언의 모든 데이터는 분산돼 있었고, 서로 연결돼 있지 않았다”라며, “그 모든 데이터를 함께 연계하는 건 간단한 일이 아니었다. 한 데이터가 데이터세트에 여러 방식으로 나타날 수 있기 때문이다. 데이터랩은 머신러닝을 활용하여 데이터세트를 학습하고 개별 데이터를 일치시켜 이 문제를 해결했다. 솔루션을 구축해보니 한 데이터세트에서 15~16개의 서로 다른 애플리케이션이 쏟아져 나왔다”라고 첸은 설명했다. 현재 ‘노코드 AI(No-code AI)’는 데이터랩의 주요 연구 분야다. 노코드 AI를 사용하면 드래그 앤드 드롭 인터페이스로 AI 및 머신러닝 모델을 구축할 수 있어 데이터 과학자 없이 일반 사용자도 AI를 활용할 수 있다. 하지만 첸은 ...

데이터 데이터 애널리틱스 노코드 AI 딥러닝 자연어 이해 자연어 처리 머신러닝 ML옵스 오토ML 비즈니스 인텔리전스 BI

2022.02.25

글로벌 신용정보평가사 ‘엑스페리언(Experian)’은 데이터를 원동력으로 하는 회사라는 사실에 자부심을 갖고 있다. 그리고 이러한 데이터 중심 활동의 선봉에는 ‘엑스페리언 데이터랩(Experian DataLabs)’이 있다. 이 사업부는 데이터로 비즈니스를 혁신할 기회를 모색하고 있다.  엑스페리언 데이터랩의 수석 부사장 겸 최고 데이터 과학자 케빈 첸은 “고객이 고수익을 얻을 기회를 포착하면 연구 자원을 투입하여 상품화 가능한 프로토타입을 개발한다”라고 말했다.  그에 따르면 데이터랩 팀은 자유롭게 실험하고 아이디어를 솔루션화하면 이를 실행할 사업부에 넘긴 다음 다시 새로운 것에 관심을 쏟는다. 첸은 “항상 새로운 아이디어를 시도해볼 수 있다. 이는 인재를 끌어들이는 하나의 매력 포인트다”라고 언급했다.    ‘노코드 AI’의 이점 엑스페리언 데이터랩은 솔루션이 비즈니스를 변혁할 수 있는 문제를 파악하는 데 중점을 두고 있으며, 첸은 이를 ‘영향력이 큰 문제(high-impact problems)’라고 부른다.  그는 소비자 신용부터 기업 신용, 온/오프라인 마케팅, 의료 정보 기술까지 여러 엑스페리언 사업부의 데이터를 연결했던 프로젝트를 예로 들었다. “과거 엑스페리언의 모든 데이터는 분산돼 있었고, 서로 연결돼 있지 않았다”라며, “그 모든 데이터를 함께 연계하는 건 간단한 일이 아니었다. 한 데이터가 데이터세트에 여러 방식으로 나타날 수 있기 때문이다. 데이터랩은 머신러닝을 활용하여 데이터세트를 학습하고 개별 데이터를 일치시켜 이 문제를 해결했다. 솔루션을 구축해보니 한 데이터세트에서 15~16개의 서로 다른 애플리케이션이 쏟아져 나왔다”라고 첸은 설명했다. 현재 ‘노코드 AI(No-code AI)’는 데이터랩의 주요 연구 분야다. 노코드 AI를 사용하면 드래그 앤드 드롭 인터페이스로 AI 및 머신러닝 모델을 구축할 수 있어 데이터 과학자 없이 일반 사용자도 AI를 활용할 수 있다. 하지만 첸은 ...

2022.02.25

AI도 과하면 독, ‘딱 맞는 해법’은 따로 있다

AI 프로젝트를 성공시키려면 비즈니스 가치, 학습용 데이터, 문화적 준비가 필수다. 이 3가지가 모두 없다면 기존 솔루션이 더 적합할 수도 있다. 인공지능(AI) 도입이 증가하고 있다. 최근 발표된 맥킨지의 설문조사 결과에 따르면 55%의 기업이 적어도 1개 부서에서 인공지능을 사용하고 있으며, 27%는 이자 및 세전 수익의 최소 5%를 AI를 통해 비용 절감의 형태로 얻고 있는 것으로 나타났다. AI가 (관련된) 거의 모든 산업을 극적으로 변화시킬 것이기 때문에 벤더와 기업들이 가능한 모든 곳에 AI를 배포할 기회를 찾고 있다는 건 놀라운 일은 아니다. 하지만 모든 프로젝트가 AI의 이점을 누릴 수 있는 건 아니며, 적절하지 않은 곳에 AI를 도입하면 시간과 비용을 낭비할 뿐만 아니라 직원, 고객, 기업 리더가 고배를 마실 수 있다. 어떤 프로젝트가 AI에 적합한지를 판단하는 핵심 요소는 ▲비즈니스 가치, ▲학습용 데이터의 가용성, ▲변화에 따른 문화적 준비 수준이다. 인공지능 이니셔티브가 매몰 비용이 되기 전에, 제안된 AI 프로젝트에 이러한 요소가 부합하는지 확인하는 방법을 살펴본다.   가장 간단한 솔루션부터 시작하라 전 세계 90여 개국에 1만 8,000개 이상의 매장을 보유하고 있는 피자 체인점 도미노의 데이터 과학 및 AI 부문 관리자 잭 프라고소는 특히 데이터 과학자가 AI 우선 접근법을 선호한다고 말했다. 하지만 모든 곳에 AI를 적용할 순 없다고 그는 지적했다.  전통적인 산업이지만 도미노는 변화를 추진해왔다. 특히 팬데믹 기간에는 더욱더 그랬다. 현재 고객들은 13가지 디지털 방식으로 피자를 주문할 수 있으며, 2020년 도미노 매출의 70% 이상은 디지털 주문에서 나왔다. 이는 AI의 가능성을 입증할 수 있는 많은 기회를 열어줬다. 프라고소는 “도미노가 AI를 도입할 때의 핵심은 간단한 접근방식을 취하는 것이었다”라며, “단순한 솔루션이 더 빠르게 실행되고 더 나은 성과를 보여주기 때문에 이를 비즈니스 파트너...

인공지능 머신러닝 디지털 트랜스포메이션 도미노 피자 데이터세트 ML옵스 질로우 NLP 데이터 과학

2022.01.25

AI 프로젝트를 성공시키려면 비즈니스 가치, 학습용 데이터, 문화적 준비가 필수다. 이 3가지가 모두 없다면 기존 솔루션이 더 적합할 수도 있다. 인공지능(AI) 도입이 증가하고 있다. 최근 발표된 맥킨지의 설문조사 결과에 따르면 55%의 기업이 적어도 1개 부서에서 인공지능을 사용하고 있으며, 27%는 이자 및 세전 수익의 최소 5%를 AI를 통해 비용 절감의 형태로 얻고 있는 것으로 나타났다. AI가 (관련된) 거의 모든 산업을 극적으로 변화시킬 것이기 때문에 벤더와 기업들이 가능한 모든 곳에 AI를 배포할 기회를 찾고 있다는 건 놀라운 일은 아니다. 하지만 모든 프로젝트가 AI의 이점을 누릴 수 있는 건 아니며, 적절하지 않은 곳에 AI를 도입하면 시간과 비용을 낭비할 뿐만 아니라 직원, 고객, 기업 리더가 고배를 마실 수 있다. 어떤 프로젝트가 AI에 적합한지를 판단하는 핵심 요소는 ▲비즈니스 가치, ▲학습용 데이터의 가용성, ▲변화에 따른 문화적 준비 수준이다. 인공지능 이니셔티브가 매몰 비용이 되기 전에, 제안된 AI 프로젝트에 이러한 요소가 부합하는지 확인하는 방법을 살펴본다.   가장 간단한 솔루션부터 시작하라 전 세계 90여 개국에 1만 8,000개 이상의 매장을 보유하고 있는 피자 체인점 도미노의 데이터 과학 및 AI 부문 관리자 잭 프라고소는 특히 데이터 과학자가 AI 우선 접근법을 선호한다고 말했다. 하지만 모든 곳에 AI를 적용할 순 없다고 그는 지적했다.  전통적인 산업이지만 도미노는 변화를 추진해왔다. 특히 팬데믹 기간에는 더욱더 그랬다. 현재 고객들은 13가지 디지털 방식으로 피자를 주문할 수 있으며, 2020년 도미노 매출의 70% 이상은 디지털 주문에서 나왔다. 이는 AI의 가능성을 입증할 수 있는 많은 기회를 열어줬다. 프라고소는 “도미노가 AI를 도입할 때의 핵심은 간단한 접근방식을 취하는 것이었다”라며, “단순한 솔루션이 더 빠르게 실행되고 더 나은 성과를 보여주기 때문에 이를 비즈니스 파트너...

2022.01.25

칼럼ㅣAI 프로젝트 악순환 고리 끊어라··· 'ML옵스' 마인드셋이 필요한 이유

커뮤니케이션 격차(communications gap)로 인해 프로덕션 단계에 도달하지 못하는 AI 프로젝트가 부지기수다.  AI 프로젝트를 아이디어에서 현실로 옮기는 것은 악순환이다. 이를 해결하는 방법은 한 가지뿐이다. 애초에 순환을 시작하지 않는 것이다.데이터는 모든 단계에서 전문적인 처리를 거쳐야 하기 때문이다. 다양한 소스에서 데이터를 추출하는 것부터 시작해 데이터 정리, 분석, 채우기까지 기존 아키텍처에 ‘ML옵스(MLOps)’, 즉 머신러닝에 관한 운영적 접근법이 없다면 머신러닝 시스템은 지연되기 쉽다.    대부분의 AI 프로젝트가 프로덕션 단계까지 가지 못하는 이유는 매우 기본적인 것처럼 보이지만 큰 영향을 미치는 격차 때문이다. 바로 데이터 과학자와 비즈니스 간 부적절한 커뮤니케이션이다.  IDC에서 진행한 설문조사 결과도 데이터 과학자와 비즈니스 간 지속적인 인게이지먼트가 중요하다고 말한다. 따라서 기업들은 즉시 사용할 수 있는 솔루션을 찾게 됐고, 바로 여기에서 ML옵스가 등장한다.  ML옵스 전략은 다음에 중점을 둔다. • 신속한 처리를 위해 데이터 추출, 모델 생성, 배포 및 모니터링에 엔드투엔드 가시성 제공 • 버전 관리 데이터 및 메타데이터 등 관련 아티팩트를 모두 저장해 프로덕션 모델의 감사 및 복제 시간 단축 • 변화하는 환경 및 요건에 따른 손쉬운 모델 재학습 • 빠르고 안전하며 정확한 ML 시스템 테스트 하지만 ML 모델을 개발, 구축 또는 학습시키는 것은 주요한 병목 요인이 아니다. 프로덕션 환경에서 큰 중단 없이 지속적인 운영을 위한 통합 AI 시스템을 구축하는 것이 실질적인 과제다.  예를 들면 ML 솔루션을 온디맨드 방식으로 배포해야 하는 조직은 실험 코드를 반복적으로 다시 작성할 수밖에 없다. 이 접근법은 애매해서 성공으로 끝날 수도 있고 그렇지 않을 수도 있다. 이게 바로 ML옵스가 해결하려고 하는 것이다.  간단히 말해, ML 모델용 ...

AI 인공지능 ML 머신러닝 ML옵스 데이터 과학 데이터옵스

2021.07.26

커뮤니케이션 격차(communications gap)로 인해 프로덕션 단계에 도달하지 못하는 AI 프로젝트가 부지기수다.  AI 프로젝트를 아이디어에서 현실로 옮기는 것은 악순환이다. 이를 해결하는 방법은 한 가지뿐이다. 애초에 순환을 시작하지 않는 것이다.데이터는 모든 단계에서 전문적인 처리를 거쳐야 하기 때문이다. 다양한 소스에서 데이터를 추출하는 것부터 시작해 데이터 정리, 분석, 채우기까지 기존 아키텍처에 ‘ML옵스(MLOps)’, 즉 머신러닝에 관한 운영적 접근법이 없다면 머신러닝 시스템은 지연되기 쉽다.    대부분의 AI 프로젝트가 프로덕션 단계까지 가지 못하는 이유는 매우 기본적인 것처럼 보이지만 큰 영향을 미치는 격차 때문이다. 바로 데이터 과학자와 비즈니스 간 부적절한 커뮤니케이션이다.  IDC에서 진행한 설문조사 결과도 데이터 과학자와 비즈니스 간 지속적인 인게이지먼트가 중요하다고 말한다. 따라서 기업들은 즉시 사용할 수 있는 솔루션을 찾게 됐고, 바로 여기에서 ML옵스가 등장한다.  ML옵스 전략은 다음에 중점을 둔다. • 신속한 처리를 위해 데이터 추출, 모델 생성, 배포 및 모니터링에 엔드투엔드 가시성 제공 • 버전 관리 데이터 및 메타데이터 등 관련 아티팩트를 모두 저장해 프로덕션 모델의 감사 및 복제 시간 단축 • 변화하는 환경 및 요건에 따른 손쉬운 모델 재학습 • 빠르고 안전하며 정확한 ML 시스템 테스트 하지만 ML 모델을 개발, 구축 또는 학습시키는 것은 주요한 병목 요인이 아니다. 프로덕션 환경에서 큰 중단 없이 지속적인 운영을 위한 통합 AI 시스템을 구축하는 것이 실질적인 과제다.  예를 들면 ML 솔루션을 온디맨드 방식으로 배포해야 하는 조직은 실험 코드를 반복적으로 다시 작성할 수밖에 없다. 이 접근법은 애매해서 성공으로 끝날 수도 있고 그렇지 않을 수도 있다. 이게 바로 ML옵스가 해결하려고 하는 것이다.  간단히 말해, ML 모델용 ...

2021.07.26

도미노피자의 데이터 과학 비밀 재료는... 'ML옵스'

글로벌 피자 브랜드 도미노(Domino’s)가 ‘ML옵스(MLOps)’를 활용하고 있다. ML옵스는 도미노의 데이터 과학팀이 IT 지원 없이도 데이터 모델을 갱신하고 프로덕션 환경에 투입할 수 있도록 지원한다.  다른 대형 브랜드와 마찬가지로 도미노 피자도 고객 서비스 향상을 위해 데이터를 많이 활용하고 있다. 그런데 세계 1위 피자 브랜드 도미노의 데이터 과학팀에는 의사결정 속도를 높이는 비밀 재료가 있다. 모델을 프로덕션 환경에 더욱더 빠르게 제공하도록 지원하는 머신러닝(Machin Learning; ML) 호스팅 플랫폼이 바로 그것이다.    도미노의 데이터 과학팀은 이 플랫폼을 사용해 다양한 ML 및 AI 모델을 실행하고 정제하며 검증한다. 또한 컴퓨팅 리소스와 관련된 IT 의존도를 낮추고 있기도 하다. 도미노의 데이터 과학 및 AI 부문 책임자 잭 프라고소에 따르면 이는 역사적으로 오랜 마찰을 빚어왔던 부분이다.  그는 “피자 주문이 상당히 많다. 데이터 과학팀은 이 주문 데이터를 처리한다”라며, “하지만 모델을 프로덕션 환경으로 투입할 방법이 빠져 있었다”라고 말했다.  비즈니스 인사이트를 얻기 위해 애널리틱스를 활용하는 건 그 자체로도 충분히 어려운 일이다. 여기에 더해 데이터 과학팀 실무자들은 IT로부터 서버, 소프트웨어 개발 환경 등 필요한 모든 것을 조달하느라 딜레이가 발생하는 문제도 해결했다.  이러한 딜레이는 의사결정 속도를 높이고 원하는 비즈니스 결과를 얻고자 ‘시간에 민감한(time-sensitive)’ 데이터 모델을 구축하는 데이터 과학팀에게 문제를 야기한다고 프라고소는 전했다.  ML옵스를 향한 도미노의 여정 140억 달러의 연매출을 올리는 도미노는 5년 차 스타트업 데이터트론(Datatron)과 협력해 이 문제를 부분적으로 완화했다. 데이터트론은 ML 모델 운영(일명 ML옵스)을 지원하는 플랫폼 구축 업체로, 이 분야에서 데이터로봇(DataRobot), 구...

도미노 데이터 과학 ML옵스 머신러닝 데이터 데이터 모델 데이터 과학자

2021.05.06

글로벌 피자 브랜드 도미노(Domino’s)가 ‘ML옵스(MLOps)’를 활용하고 있다. ML옵스는 도미노의 데이터 과학팀이 IT 지원 없이도 데이터 모델을 갱신하고 프로덕션 환경에 투입할 수 있도록 지원한다.  다른 대형 브랜드와 마찬가지로 도미노 피자도 고객 서비스 향상을 위해 데이터를 많이 활용하고 있다. 그런데 세계 1위 피자 브랜드 도미노의 데이터 과학팀에는 의사결정 속도를 높이는 비밀 재료가 있다. 모델을 프로덕션 환경에 더욱더 빠르게 제공하도록 지원하는 머신러닝(Machin Learning; ML) 호스팅 플랫폼이 바로 그것이다.    도미노의 데이터 과학팀은 이 플랫폼을 사용해 다양한 ML 및 AI 모델을 실행하고 정제하며 검증한다. 또한 컴퓨팅 리소스와 관련된 IT 의존도를 낮추고 있기도 하다. 도미노의 데이터 과학 및 AI 부문 책임자 잭 프라고소에 따르면 이는 역사적으로 오랜 마찰을 빚어왔던 부분이다.  그는 “피자 주문이 상당히 많다. 데이터 과학팀은 이 주문 데이터를 처리한다”라며, “하지만 모델을 프로덕션 환경으로 투입할 방법이 빠져 있었다”라고 말했다.  비즈니스 인사이트를 얻기 위해 애널리틱스를 활용하는 건 그 자체로도 충분히 어려운 일이다. 여기에 더해 데이터 과학팀 실무자들은 IT로부터 서버, 소프트웨어 개발 환경 등 필요한 모든 것을 조달하느라 딜레이가 발생하는 문제도 해결했다.  이러한 딜레이는 의사결정 속도를 높이고 원하는 비즈니스 결과를 얻고자 ‘시간에 민감한(time-sensitive)’ 데이터 모델을 구축하는 데이터 과학팀에게 문제를 야기한다고 프라고소는 전했다.  ML옵스를 향한 도미노의 여정 140억 달러의 연매출을 올리는 도미노는 5년 차 스타트업 데이터트론(Datatron)과 협력해 이 문제를 부분적으로 완화했다. 데이터트론은 ML 모델 운영(일명 ML옵스)을 지원하는 플랫폼 구축 업체로, 이 분야에서 데이터로봇(DataRobot), 구...

2021.05.06

블로그 | "통합적 데이터 도구"에 거는 희미한 기대

클라우드와 각종 플랫폼 기술의 시대 속에서 ‘통합적’(unified)이라는 단어는 진부하기 그지없다. 통합 플랫폼, 통합 툴셋, 통합적 접근, 통합적 UI, 통합적 기능 세트 등이 표현이 그야말로 난무한다.  IT계에는 제멋대로 가져다 쓰는 용어가 많다. 기술 업체들에게 있는 아주 나쁜 버릇은 ‘편재적(pervasive)’이니, ‘총체적(holistic)’이니, 옛날부터 즐겨 쓰던 ‘엔드투엔드(end-to-end)’니 하는 용어와 표현을 기초적인 소프트웨어 요소에도 양념처럼 쓰는 것이다. 플랫폼 기술 시대를 맞은 오늘날 클라우드 컴퓨팅계에서 유독 남발되는 용어은 ‘통합적(unified)’이라는 말일 것이다. 소프트웨어 업체들은 자기 회사의 통합적 플랫폼과 통합적 도구모음, 통합적 접근 방식은 물론 통합적 UI를 내세운다. 운이 나쁘다면 해당 회사의 통합적 우수성에 대한 통합적 메시지를 들을 수도 있겠다.  -> IT 업계 ‘아무말 대잔치’··· 오남용 심한 유행어 10선 ‘통합적’이 진정 의미있는 경우 통합적 기술 아키텍처가 진정 도움이 되려면 한 번에 여러 가지 핵심 작업을 할 수 있어야 한다. 아니면 적어도 필수 기능을 2가지 이상 즉시, 순차적으로, 아니면 심지어 동시에 수행할 수 있어야 한다. 클라우드 데이터 관리 회사 인포매티카(Informatica)는 아파치 스파크(Apache Spark) 기반의 서버리스 클라우드 데이터 통합 엔진 제품을 출시하면서 실용적인 통합적 기량을 뽐낼 수 있을 것으로 기대 중이다. 여기서 통합적 매력의 원천인 아파치 스파크는 대규모 데이터 처리를 위한 일종의 오픈소스 통합 분석 엔진이다.  데이터브릭스(Databricks)에서 처음 아파치 스파크를 만든 사람들 중 한 명인 마테이 자하리아에 따르면 “아파치 스파크가 진정 통합적인 이유는 빅데이터 변환 및 분석을 할 수 있고 변환과 분석이 끝난 빅 데이터에 사용자가 즉시 최첨단 ML 및 AI 알고리즘을 실행할 수 있기 때문이...

인포매티나 시민 개발자 통합 데이터 플랫폼 통합적 데이터 플랫폼 ML옵스 클라우드 데이터 통합 엔진

2021.03.18

클라우드와 각종 플랫폼 기술의 시대 속에서 ‘통합적’(unified)이라는 단어는 진부하기 그지없다. 통합 플랫폼, 통합 툴셋, 통합적 접근, 통합적 UI, 통합적 기능 세트 등이 표현이 그야말로 난무한다.  IT계에는 제멋대로 가져다 쓰는 용어가 많다. 기술 업체들에게 있는 아주 나쁜 버릇은 ‘편재적(pervasive)’이니, ‘총체적(holistic)’이니, 옛날부터 즐겨 쓰던 ‘엔드투엔드(end-to-end)’니 하는 용어와 표현을 기초적인 소프트웨어 요소에도 양념처럼 쓰는 것이다. 플랫폼 기술 시대를 맞은 오늘날 클라우드 컴퓨팅계에서 유독 남발되는 용어은 ‘통합적(unified)’이라는 말일 것이다. 소프트웨어 업체들은 자기 회사의 통합적 플랫폼과 통합적 도구모음, 통합적 접근 방식은 물론 통합적 UI를 내세운다. 운이 나쁘다면 해당 회사의 통합적 우수성에 대한 통합적 메시지를 들을 수도 있겠다.  -> IT 업계 ‘아무말 대잔치’··· 오남용 심한 유행어 10선 ‘통합적’이 진정 의미있는 경우 통합적 기술 아키텍처가 진정 도움이 되려면 한 번에 여러 가지 핵심 작업을 할 수 있어야 한다. 아니면 적어도 필수 기능을 2가지 이상 즉시, 순차적으로, 아니면 심지어 동시에 수행할 수 있어야 한다. 클라우드 데이터 관리 회사 인포매티카(Informatica)는 아파치 스파크(Apache Spark) 기반의 서버리스 클라우드 데이터 통합 엔진 제품을 출시하면서 실용적인 통합적 기량을 뽐낼 수 있을 것으로 기대 중이다. 여기서 통합적 매력의 원천인 아파치 스파크는 대규모 데이터 처리를 위한 일종의 오픈소스 통합 분석 엔진이다.  데이터브릭스(Databricks)에서 처음 아파치 스파크를 만든 사람들 중 한 명인 마테이 자하리아에 따르면 “아파치 스파크가 진정 통합적인 이유는 빅데이터 변환 및 분석을 할 수 있고 변환과 분석이 끝난 빅 데이터에 사용자가 즉시 최첨단 ML 및 AI 알고리즘을 실행할 수 있기 때문이...

2021.03.18

머신러닝 라이프사이클 관리를 돕는 'ML옵스 플랫폼' 10종

대부분의 전문 소프트웨어 개발자에게 애플리케이션 라이프사이클 관리(Application Lifecycle Management, ALM)는 당연히 사용하는 툴이다. 그러나 소프트웨어 개발 배경이 없는 경우가 많은 데이터 과학자는 대체로 머신러닝 모델에 라이프사이클 관리를 사용해본 적이 없을 것이다. 머신러닝 라이프사이클 관리를 지원하는 ML옵스(MLops) 환경과 프레임워크가 등장한 후에는 몇 년 전보다 훨씬 쉽게 이 문제를 해결할 수 있다.   머신러닝 라이프사이클 관리란? 쉽게 답하자면 애플리케이션 라이프사이클 관리와 같다고 할 수 있지만 이 답은 틀리기도 하다. 머신러닝 모델의 라이프사이클은 여러 측면에서 소프트웨어 개발 라이프사이클(SDLC)과는 다르기 때문이다.   우선 소프트웨어 개발자는 코드를 쓰기 전에 무엇을 만들고자 하는지를 어느정도 알고 시작한다. 고정된 전체적인 사양이 있거나(폭포수 모델) 없을 수 있지만(애자일 개발), 어느 시점에서든 소프트웨어 개발자는 설명 가능한 기능을 빌드, 테스트, 디버그하기 위해 노력한다. 또한 소프트웨어 개발자는 이 기능이 설계대로 작동하는지 확인하기 위한 테스트도 할 수 있다.   반면, 데이터 과학자는 최적화 알고리즘이 데이터 집합을 설명하기 위한 최적의 가중치 집합을 찾는 실험을 통해 모델을 구축한다. 모델의 종류는 많고 현재 최적을 판단하는 유일한 방법은 모두 시도하는 것이다. 또한 소프트웨어 테스트에는 사실상 없는 개념인 모델의 ‘올바름’에 관한 여러 기준이 존재할 수도 있다.   그러나 일부 최선의 모델(예를 들어 심층 신경망)을 학습시키는 데는 오랜 시간이 걸린다. 그래서 데이터 과학에는 GPU, TPU, FPGA와 같은 가속기가 중요해졌다. 또한 모델이 가능한 한 잘 작동하도록 하기 위해 최초 관찰로부터 데이터를 정제하고 최적의 특성 집합을 엔지니어링하는 데에도 상당한 노력이 필요하다.   고정된 데이터 집합을 사용하는 경우에도 수백 회의 실험과 수십 가...

ML옵스 MLops MLM 머신러닝라이프사이클관리

2020.09.24

대부분의 전문 소프트웨어 개발자에게 애플리케이션 라이프사이클 관리(Application Lifecycle Management, ALM)는 당연히 사용하는 툴이다. 그러나 소프트웨어 개발 배경이 없는 경우가 많은 데이터 과학자는 대체로 머신러닝 모델에 라이프사이클 관리를 사용해본 적이 없을 것이다. 머신러닝 라이프사이클 관리를 지원하는 ML옵스(MLops) 환경과 프레임워크가 등장한 후에는 몇 년 전보다 훨씬 쉽게 이 문제를 해결할 수 있다.   머신러닝 라이프사이클 관리란? 쉽게 답하자면 애플리케이션 라이프사이클 관리와 같다고 할 수 있지만 이 답은 틀리기도 하다. 머신러닝 모델의 라이프사이클은 여러 측면에서 소프트웨어 개발 라이프사이클(SDLC)과는 다르기 때문이다.   우선 소프트웨어 개발자는 코드를 쓰기 전에 무엇을 만들고자 하는지를 어느정도 알고 시작한다. 고정된 전체적인 사양이 있거나(폭포수 모델) 없을 수 있지만(애자일 개발), 어느 시점에서든 소프트웨어 개발자는 설명 가능한 기능을 빌드, 테스트, 디버그하기 위해 노력한다. 또한 소프트웨어 개발자는 이 기능이 설계대로 작동하는지 확인하기 위한 테스트도 할 수 있다.   반면, 데이터 과학자는 최적화 알고리즘이 데이터 집합을 설명하기 위한 최적의 가중치 집합을 찾는 실험을 통해 모델을 구축한다. 모델의 종류는 많고 현재 최적을 판단하는 유일한 방법은 모두 시도하는 것이다. 또한 소프트웨어 테스트에는 사실상 없는 개념인 모델의 ‘올바름’에 관한 여러 기준이 존재할 수도 있다.   그러나 일부 최선의 모델(예를 들어 심층 신경망)을 학습시키는 데는 오랜 시간이 걸린다. 그래서 데이터 과학에는 GPU, TPU, FPGA와 같은 가속기가 중요해졌다. 또한 모델이 가능한 한 잘 작동하도록 하기 위해 최초 관찰로부터 데이터를 정제하고 최적의 특성 집합을 엔지니어링하는 데에도 상당한 노력이 필요하다.   고정된 데이터 집합을 사용하는 경우에도 수백 회의 실험과 수십 가...

2020.09.24

알고리드미아, 소규모 그룹을 지원하는 ‘ML옵스’ 서비스 공개 

‘알고리드미아 팀즈(Algorithmia Teams)’은 소규모 그룹을 대상으로 머신러닝 운영 및 관리 기능을 제공하는 종량제 과금 방식(pay-as-you-go)의 클라우드 서비스다.    머신러닝 툴 개발 업체 알고리드미아가 25일(현지 시각) 기업의 소규모 그룹을 위한 머신러닝 운영 및 관리 플랫폼 ‘알고리드미아 팀즈’를 공개했다. 머신러닝 모델을 실제 프로덕션 환경에 빠르게 배포할 수 있는 이 클라우드 기반 서비스는 엔터프라이즈급 ML옵스 플랫폼의 성능과 함께 클라우드 서비스의 비용 유연성을 제공하도록 설계됐다.  종량제 과금 방식을 적용, 초기 투자 비용을 줄이고 필요에 따라 플랫폼 사용을 확장할 수 있다. 다시 말해, ‘알고리드미아 팀즈’는 일부 기업이 AI/ML 프로젝트 관리에 필요한 툴뿐만 아니라 비용에서도 제약을 받는 상황을 해결하고자 한다.  ‘알고리드미아 팀즈’는 기본 버전과 프로페셔널 버전으로 제공된다. 두 버전 모두 보안이 확보된 협업 공간, 외부 클라우드 데이터 소스(예: AWS, MS 애저, GCP)를 연결하는 커넥터를 제공한다. 프로페셔널 버전에는 고급 지원, 전용 슬랙 채널, 커스텀 언어 팩 또는 데이터 커넥터 개발 구매 옵션이 포함돼 있다. 프로페셔널 버전은 월 299달러에, CPU/GPU 사용량 기준으로 종량제 과금 방식이 적용된다. 기본 버전은 월 사용료를 내지 않으며 종량제 과금 방식만 적용된다. ciokr@idg.co.kr  

알고리드미아 머신러닝 인공지능 ML옵스 종량제 클라우드 슬랙

2020.08.28

‘알고리드미아 팀즈(Algorithmia Teams)’은 소규모 그룹을 대상으로 머신러닝 운영 및 관리 기능을 제공하는 종량제 과금 방식(pay-as-you-go)의 클라우드 서비스다.    머신러닝 툴 개발 업체 알고리드미아가 25일(현지 시각) 기업의 소규모 그룹을 위한 머신러닝 운영 및 관리 플랫폼 ‘알고리드미아 팀즈’를 공개했다. 머신러닝 모델을 실제 프로덕션 환경에 빠르게 배포할 수 있는 이 클라우드 기반 서비스는 엔터프라이즈급 ML옵스 플랫폼의 성능과 함께 클라우드 서비스의 비용 유연성을 제공하도록 설계됐다.  종량제 과금 방식을 적용, 초기 투자 비용을 줄이고 필요에 따라 플랫폼 사용을 확장할 수 있다. 다시 말해, ‘알고리드미아 팀즈’는 일부 기업이 AI/ML 프로젝트 관리에 필요한 툴뿐만 아니라 비용에서도 제약을 받는 상황을 해결하고자 한다.  ‘알고리드미아 팀즈’는 기본 버전과 프로페셔널 버전으로 제공된다. 두 버전 모두 보안이 확보된 협업 공간, 외부 클라우드 데이터 소스(예: AWS, MS 애저, GCP)를 연결하는 커넥터를 제공한다. 프로페셔널 버전에는 고급 지원, 전용 슬랙 채널, 커스텀 언어 팩 또는 데이터 커넥터 개발 구매 옵션이 포함돼 있다. 프로페셔널 버전은 월 299달러에, CPU/GPU 사용량 기준으로 종량제 과금 방식이 적용된다. 기본 버전은 월 사용료를 내지 않으며 종량제 과금 방식만 적용된다. ciokr@idg.co.kr  

2020.08.28

머신러닝 운영과 관리, 'ML옵스'가 뜬다

데이터 과학자가 데이터를 태깅하고 정확한 머신러닝 모델을 만들기가 어렵다고 하지만, 프로덕션에서 머신러닝 모델을 관리하는 일은 이보다 더 까다로울 수 있다. 모델 드리프트(Model Drift) 인식, 업데이트된 데이터 집합을 사용한 모델 재학습, 성능 개선, 기반 기술 플랫폼 유지보수, 모두 중요한 데이터 과학의 작업들이다. 이와 같은 작업이 없으면 모델이 잘못된 결과를 생산하고 결과적으로 비즈니스에 큰 피해가 발생할 수 있다.   프로덕션급 모델 개발은 쉬운 일이 아니다. 한 머신러닝 연구에 따르면, 기업의 55%는 모델을 프로덕션에 구축한 적이 없고, 약 40%는 모델 하나를 배포하는 데 30일 이상이 소요되는 것으로 나타났다. 성공에는 새로운 과제가 따른다. 응답 기업의 41%는 머신러닝 모델의 버전 관리와 재현 가능성에 어려움을 느낀다고 답했다. 여기서 얻을 수 있는 교훈은 머신러닝 모델이 프로덕션에 구축되어 비즈니스 프로세스에 사용하기 시작하면 새로운 장애물이 나타난다는 것이다. 모델 관리와 운영은 한때 숙련된 데이터 과학 팀을 위한 과제라는 인식이 있었다. 현재 모델 관리와 운영 작업에는 프로덕션 머신러닝 모델의 드리프트 모니터링, 모델 재학습 자동화, 드리프트가 심할 경우 알림, 모델에 업그레이드가 필요할 때 인식하기 등이 포함된다. 머신러닝에 투자하는 기업이 늘어나면서 모델 관리와 운영에 대한 인식을 구축해야 할 필요성도 커지고 있다. 좋은 소식은 오픈소스 ML플로우(MLFlow), DVC와 같은 플랫폼과 라이브러리, 그리고 알터릭스(Alteryx), 데이터브릭스(Databricks), 다타이쿠(Dataiku), SAS, 데이터로봇(DataRobot), 모델옵(ModelOp)의 상용 툴 등으로 데이터 과학 팀의 모델 관리와 운영이 한결 쉬워졌다는 점이다. 퍼블릭 클라우드 제공업체도 애저 머신러닝에서 ML옵스 구현하기와 같은 수행 방법을 공유하고 있다. 머신러닝 모델 관리와 데브옵스 간에는 여러 유사점이 있다. 많은 사람은 모...

ML옵스 MLops

2020.08.26

데이터 과학자가 데이터를 태깅하고 정확한 머신러닝 모델을 만들기가 어렵다고 하지만, 프로덕션에서 머신러닝 모델을 관리하는 일은 이보다 더 까다로울 수 있다. 모델 드리프트(Model Drift) 인식, 업데이트된 데이터 집합을 사용한 모델 재학습, 성능 개선, 기반 기술 플랫폼 유지보수, 모두 중요한 데이터 과학의 작업들이다. 이와 같은 작업이 없으면 모델이 잘못된 결과를 생산하고 결과적으로 비즈니스에 큰 피해가 발생할 수 있다.   프로덕션급 모델 개발은 쉬운 일이 아니다. 한 머신러닝 연구에 따르면, 기업의 55%는 모델을 프로덕션에 구축한 적이 없고, 약 40%는 모델 하나를 배포하는 데 30일 이상이 소요되는 것으로 나타났다. 성공에는 새로운 과제가 따른다. 응답 기업의 41%는 머신러닝 모델의 버전 관리와 재현 가능성에 어려움을 느낀다고 답했다. 여기서 얻을 수 있는 교훈은 머신러닝 모델이 프로덕션에 구축되어 비즈니스 프로세스에 사용하기 시작하면 새로운 장애물이 나타난다는 것이다. 모델 관리와 운영은 한때 숙련된 데이터 과학 팀을 위한 과제라는 인식이 있었다. 현재 모델 관리와 운영 작업에는 프로덕션 머신러닝 모델의 드리프트 모니터링, 모델 재학습 자동화, 드리프트가 심할 경우 알림, 모델에 업그레이드가 필요할 때 인식하기 등이 포함된다. 머신러닝에 투자하는 기업이 늘어나면서 모델 관리와 운영에 대한 인식을 구축해야 할 필요성도 커지고 있다. 좋은 소식은 오픈소스 ML플로우(MLFlow), DVC와 같은 플랫폼과 라이브러리, 그리고 알터릭스(Alteryx), 데이터브릭스(Databricks), 다타이쿠(Dataiku), SAS, 데이터로봇(DataRobot), 모델옵(ModelOp)의 상용 툴 등으로 데이터 과학 팀의 모델 관리와 운영이 한결 쉬워졌다는 점이다. 퍼블릭 클라우드 제공업체도 애저 머신러닝에서 ML옵스 구현하기와 같은 수행 방법을 공유하고 있다. 머신러닝 모델 관리와 데브옵스 간에는 여러 유사점이 있다. 많은 사람은 모...

2020.08.26

IDG 설문조사

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.31