2021.08.19

칼럼ㅣRPA와 데이터 과학이 만날 때

Michael Berthold | InfoWorld
‘데이터 과학’은 ‘RPA(Robotic Process Automation)’를 지능적으로 만들 수 있다. 그리고 RPA는 데이터 과학 모델을 프로덕션 환경에 쉽게 배포하도록 만들 수 있다. 

RPA 벤더들은 ‘완전 자동화 기업’이라는 지향점을 제시하지만 어쩌면 이는 다분히 근시안적인 관점일 수 있다. 현재 트렌드를 보면 RPA로 할 수 있는 일이 굉장히 많기 때문이다. 특히 데이터 과학과 결합됐을 때 더욱더 그렇다. 
 
ⓒGetty Images

RPA 도구는 사람이 하는 일 가운데 반복적인 작업을 컴퓨터가 대신하도록 하면서 시작됐다. 여기서 ‘로봇’이라는 말이 핵심이다. 소프트웨어가 하나의 시스템에 들어있는 게 아니라 사람이 만지는 모든(또는 많은) 정보 시스템과 연결돼 있음을 은유적으로 나타나기 때문이다. 

초창기 RPA 솔루션은 사람이 시스템과 상호작용하는 방식을 모방했다. 예를 들면 ‘지원(support)’ 관련 통화는 기술팀으로, ‘판매(sales)’ 관련 통화는 영업팀으로 자동 라우팅하거나 또는 링크드인(LinkedIn)과 같은 웹 사이트에서 정보를 스크랩해 필요할 때마다 CRM 시스템에 추가하는 식이었다. 

그리고 RPA가 데이터 과학을 ‘처음’ 만났을 때 이는 업계를 변화시키는 결과를 가져왔다. 사람이 자동화를 개선할 새 기회를 찾게 하는 대신 ‘지능형’ 프로세스 자동화를 활용하게 됐기 때문이다. 

이제는 머신러닝을 통해 실제 프로세스에서 패턴을 찾고 이를 프로세스 마이닝이라는 기술을 사용해 자동으로 개선할 수 있다. 이는 그동안 많은 RPA 도구가 내세웠던 ‘완전 자동화 기업’을 향한 발걸음이었다. 

RPA와 데이터 과학의 두 번째 만남이 새로운 문을 열고 있다. 이번에는 데이터 과학이 사람의 업무 효율성을 높이는 데 도움을 줄 뿐만 아니라 이러한 작업의 일부를 더욱더 잘 실행하는 데도 도움을 주고 있다. 

RPA와 데이터 과학이 다시 만나다
점점 더 많은 수의 자동화 프로세스가 데이터를 처리하고 있다. 대부분의 RPA 프로그램은 사람이 (직접) 클릭하는 일을 줄이는 한편 데이터 다운로드, 분류, 결합, (심지어는) 가공 등의 작업을 수행하고 있다. 더 나아가서는 머신러닝 모델을 호출하고 이를 통한 결과 예측을 자동화에 추가하고 있다. 

데이터 과학은 단순히 프로세스의 속도를 향상시킨다고 하기보다는 프로세스 내부에 사용돼 작업을 더욱더 지능적으로 실행할 수 있도록 한다. 

RPA를 사용하여 프로세스를 디지털화하고 직원의 효율성을 향상했다면 이제 한 단계 더 나아가 정교한 데이터 과학 기술을 프로세스에 통합할 수 있다. 이를 통해 프로세스 자동화는 더욱더 지능화되고, 실제 데이터 과학은 더욱더 자동화될 수 있다.   

로우코드 도구가 길을 닦아준다
이러한 트렌드가 (적어도 부분적으로는) 로우코드 도구에 의해 가능해지고 있다. 로우코드 도구는 복잡한 기술 프로세스를 사람이 이해할 수 있도록 직관적으로 만들어 주는 기술이다. 즉 이를 통해 RPA 및 데이터 과학의 고급 버전을 쉽게 설명하고 알릴 수 있다. 

로우코드, 시각화 플랫폼은 RPA나 데이터 과학에서 새로운 것은 아니다. 로우코드는 (일반적으로 왼쪽에서 오른쪽으로 이동하는) ‘플로우’에서 시각적으로 연결된 모듈을 포함한다. 이러한 시각적 표현은 자체적으로 문서화되며 새 프로젝트에 쉽게 재사용할 수 있다. 

시각적 플랫폼이 RPA와 데이터 과학의 사용 사례에 적용되는 방식의 차이는 미묘하지만 중요하다. RPA에서는 플로우가 제어 흐름의 순서, 즉 차례대로 수행되는 일련의 작업을 나타낸다. 이러한 작업 중에는 특정 트랜잭션 승인과 같은 사람의 상호작용을 포함할 수도 있다. 

반면 데이터 과학에서 플로우는 데이터로 하는 작업, 다양한 스토리지(예: 엑셀 파일, 하이브리드 클라우드 데이터베이스 등)에서 데이터를 결합하는 방식, 데이터 변환 및 집계 방식, 머신러닝 알고리즘 또는 기타 분석 방법에 데이터를 제공하는 방식을 나타낸다. 

위에서 언급한 대로 중복되는 부분이 있다. 데이터 플로우는 제어 흐름뿐만 아니라 그 반대에도 존재한다. 전문 데이터 과학 ‘비주얼 프로그래밍’ 환경에서는 매개변수를 최적화하고 어떤 모델을 배포할지 결정하는 제어 메커니즘을 추가해야 한다. 

RPA와 데이터 과학이 모두 성공하려면 여러 기술을 통합해야 하는데, 로우코드는 기술을 구현할 때 생기는 마찰을 크게 줄일 수 있다. 물론 이러한 구현을 수동으로 코딩할 수 있겠지만 다양한 코딩 언어를 마스터하고 이를 비즈니스 파트너와 공유해야 한다는 점에서 많은 노력이 들 수 있다. 
 
RPA와 데이터 프로세스 자동화
데이터 과학은 아직 성숙할 필요가 있다. ETL 및 머신러닝 모델이 상당히 정교해지긴 했지만 실제 프로덕션 환경에 이러한 모델을 적용하려고 하면 여전히 많은 문제에 부딪히기 때문이다. 

이것이 이른바 간극이다. 즉 모델을 가져다가 프로덕션 환경에서 실행시키고 유지관리하며 언제 조정해야 할지 알아야 한다. 

프로덕션 환경에 데이터 과학을 구축하는 것은 본질적으로 RPA 문제다. 모델 그리고 모델 통합에 사용한 기술 간의 제어 흐름을 어떻게 만들 것인가? 

어쩌면 데이터 과학은 가장 큰 과제는 이미 해결됐을지도 모른다. 그저 그 소식을 널리 알리기만 하면 된다. 또한 이를 ‘데이터 과학 구축’이라고 하기보다는 ‘데이터 프로세스 자동화’라고 해야 할 것이다. 

* Michael Berthold는 오픈소스 데이터 분석 기업 KNIME의 CEO이자 공동 설립자다. ciokr@idg.co.kr
 



2021.08.19

칼럼ㅣRPA와 데이터 과학이 만날 때

Michael Berthold | InfoWorld
‘데이터 과학’은 ‘RPA(Robotic Process Automation)’를 지능적으로 만들 수 있다. 그리고 RPA는 데이터 과학 모델을 프로덕션 환경에 쉽게 배포하도록 만들 수 있다. 

RPA 벤더들은 ‘완전 자동화 기업’이라는 지향점을 제시하지만 어쩌면 이는 다분히 근시안적인 관점일 수 있다. 현재 트렌드를 보면 RPA로 할 수 있는 일이 굉장히 많기 때문이다. 특히 데이터 과학과 결합됐을 때 더욱더 그렇다. 
 
ⓒGetty Images

RPA 도구는 사람이 하는 일 가운데 반복적인 작업을 컴퓨터가 대신하도록 하면서 시작됐다. 여기서 ‘로봇’이라는 말이 핵심이다. 소프트웨어가 하나의 시스템에 들어있는 게 아니라 사람이 만지는 모든(또는 많은) 정보 시스템과 연결돼 있음을 은유적으로 나타나기 때문이다. 

초창기 RPA 솔루션은 사람이 시스템과 상호작용하는 방식을 모방했다. 예를 들면 ‘지원(support)’ 관련 통화는 기술팀으로, ‘판매(sales)’ 관련 통화는 영업팀으로 자동 라우팅하거나 또는 링크드인(LinkedIn)과 같은 웹 사이트에서 정보를 스크랩해 필요할 때마다 CRM 시스템에 추가하는 식이었다. 

그리고 RPA가 데이터 과학을 ‘처음’ 만났을 때 이는 업계를 변화시키는 결과를 가져왔다. 사람이 자동화를 개선할 새 기회를 찾게 하는 대신 ‘지능형’ 프로세스 자동화를 활용하게 됐기 때문이다. 

이제는 머신러닝을 통해 실제 프로세스에서 패턴을 찾고 이를 프로세스 마이닝이라는 기술을 사용해 자동으로 개선할 수 있다. 이는 그동안 많은 RPA 도구가 내세웠던 ‘완전 자동화 기업’을 향한 발걸음이었다. 

RPA와 데이터 과학의 두 번째 만남이 새로운 문을 열고 있다. 이번에는 데이터 과학이 사람의 업무 효율성을 높이는 데 도움을 줄 뿐만 아니라 이러한 작업의 일부를 더욱더 잘 실행하는 데도 도움을 주고 있다. 

RPA와 데이터 과학이 다시 만나다
점점 더 많은 수의 자동화 프로세스가 데이터를 처리하고 있다. 대부분의 RPA 프로그램은 사람이 (직접) 클릭하는 일을 줄이는 한편 데이터 다운로드, 분류, 결합, (심지어는) 가공 등의 작업을 수행하고 있다. 더 나아가서는 머신러닝 모델을 호출하고 이를 통한 결과 예측을 자동화에 추가하고 있다. 

데이터 과학은 단순히 프로세스의 속도를 향상시킨다고 하기보다는 프로세스 내부에 사용돼 작업을 더욱더 지능적으로 실행할 수 있도록 한다. 

RPA를 사용하여 프로세스를 디지털화하고 직원의 효율성을 향상했다면 이제 한 단계 더 나아가 정교한 데이터 과학 기술을 프로세스에 통합할 수 있다. 이를 통해 프로세스 자동화는 더욱더 지능화되고, 실제 데이터 과학은 더욱더 자동화될 수 있다.   

로우코드 도구가 길을 닦아준다
이러한 트렌드가 (적어도 부분적으로는) 로우코드 도구에 의해 가능해지고 있다. 로우코드 도구는 복잡한 기술 프로세스를 사람이 이해할 수 있도록 직관적으로 만들어 주는 기술이다. 즉 이를 통해 RPA 및 데이터 과학의 고급 버전을 쉽게 설명하고 알릴 수 있다. 

로우코드, 시각화 플랫폼은 RPA나 데이터 과학에서 새로운 것은 아니다. 로우코드는 (일반적으로 왼쪽에서 오른쪽으로 이동하는) ‘플로우’에서 시각적으로 연결된 모듈을 포함한다. 이러한 시각적 표현은 자체적으로 문서화되며 새 프로젝트에 쉽게 재사용할 수 있다. 

시각적 플랫폼이 RPA와 데이터 과학의 사용 사례에 적용되는 방식의 차이는 미묘하지만 중요하다. RPA에서는 플로우가 제어 흐름의 순서, 즉 차례대로 수행되는 일련의 작업을 나타낸다. 이러한 작업 중에는 특정 트랜잭션 승인과 같은 사람의 상호작용을 포함할 수도 있다. 

반면 데이터 과학에서 플로우는 데이터로 하는 작업, 다양한 스토리지(예: 엑셀 파일, 하이브리드 클라우드 데이터베이스 등)에서 데이터를 결합하는 방식, 데이터 변환 및 집계 방식, 머신러닝 알고리즘 또는 기타 분석 방법에 데이터를 제공하는 방식을 나타낸다. 

위에서 언급한 대로 중복되는 부분이 있다. 데이터 플로우는 제어 흐름뿐만 아니라 그 반대에도 존재한다. 전문 데이터 과학 ‘비주얼 프로그래밍’ 환경에서는 매개변수를 최적화하고 어떤 모델을 배포할지 결정하는 제어 메커니즘을 추가해야 한다. 

RPA와 데이터 과학이 모두 성공하려면 여러 기술을 통합해야 하는데, 로우코드는 기술을 구현할 때 생기는 마찰을 크게 줄일 수 있다. 물론 이러한 구현을 수동으로 코딩할 수 있겠지만 다양한 코딩 언어를 마스터하고 이를 비즈니스 파트너와 공유해야 한다는 점에서 많은 노력이 들 수 있다. 
 
RPA와 데이터 프로세스 자동화
데이터 과학은 아직 성숙할 필요가 있다. ETL 및 머신러닝 모델이 상당히 정교해지긴 했지만 실제 프로덕션 환경에 이러한 모델을 적용하려고 하면 여전히 많은 문제에 부딪히기 때문이다. 

이것이 이른바 간극이다. 즉 모델을 가져다가 프로덕션 환경에서 실행시키고 유지관리하며 언제 조정해야 할지 알아야 한다. 

프로덕션 환경에 데이터 과학을 구축하는 것은 본질적으로 RPA 문제다. 모델 그리고 모델 통합에 사용한 기술 간의 제어 흐름을 어떻게 만들 것인가? 

어쩌면 데이터 과학은 가장 큰 과제는 이미 해결됐을지도 모른다. 그저 그 소식을 널리 알리기만 하면 된다. 또한 이를 ‘데이터 과학 구축’이라고 하기보다는 ‘데이터 프로세스 자동화’라고 해야 할 것이다. 

* Michael Berthold는 오픈소스 데이터 분석 기업 KNIME의 CEO이자 공동 설립자다. ciokr@idg.co.kr
 

X