2017.10.27

블로그 | AI, 데이터 과학자 업무에도 침투하다

James Kobielus | InfoWorld
데이터 과학에서 인간만이 담당할 수 있었던 업무를 수행하는 도구가 등장했다. 데이터 과학자라는 직업의 미래에도 경고 신호가 켜질지도 모른다.

인공지능의 발전하면서 일자리 위기가 발생할 것이라는 위기감이 고조되고 있다. 단순 업무 뿐 아니라 복잡한 사무직도 압박할 수 있는 능력이 속속 입증되고 있기 때문이다.

흔히 '자동화'라는 용어가 등장하는 이러한 논의에 있어 데이터 과학자조차도 직업 안정성에 대해 생각하기 시작했다. 필자는 최근 머신러닝 모델을 '운영화'(operationalizing)할 수 있도록 고안된 알터릭스(Alteryx)의 신규 도구에 대한 앤드류 브루스트의 글을 흥미롭게 읽었다.

그는 이 글에서 알터릭스의 도구가 데이터 과학 업무의 생산성을 높일 것이라고 언급하면서도 향후 여러 벤더가 다양한 수준의 자동화 도구를 공급할 가능성에 대해 제시했다. 데이터 과학 개발, 배치, 워크플로우 최적화 등의 업무가 점차 자동화되어갈 수 있다는 설명이다.

알터릭스의 도구가 제시하는 기능들에 대해 살펴보면 다음과 같다.

- 코드 없는 알터릭스 디자이너툴은 머신러닝 모델과 관련해 자동으로 커스터마이즈된 REST APIs와 도커 이미지를 생성한다.

- 알터릭스의 새로운 프로모트(Promote) 툴은 알터릭스 서버애널리틱스 플랫폼에서 실행을 위한 모델을 자동으로 배치한다. 참고로 이 툴은 알터릭스가 최근 Yhat을 인수하면서 확보한 데이터 과학 모델 관리 기술을 이용하고 있다.

- 프로모트는 애플리케이션 요구 사항의 변화에 따라 각 모델의 런타임 리소스 소비를 자동으로 조정할 수 있다.

- 디자이너 워크플로우는 머신러닝 모델을 자동으로 재훈련시키도록 설정될 수 있다. 새로운 데이터가 입력되면 프로모트에의 인터페이스가 그게 맞춰 재배치된다. 그러면 프로모트는 어떤 모델 버전이 현재 배치되어 있는지 추적해 모델 거버넌스를 자동으로 보장한다. 이로 인해 예측성을 보유한 모델이 늘 존재할 수 있게 된다.

부루스트는 그러나 현재로서는 데이터 과학 워크플로우에 있어 수동 작업을 줄이려는 노력이 '단점보다는 장점'이 많을 것이라고 언급했다. 실제로 오늘날 데이터 과학 작업에는 수많은 저수준 노동이 포함돼 있는 것이 사실이다.

필자 또한 데이터 과학에서 자동화의 위험성을 굳이 과장할 필요는 없다고 판단한다. 반복적인 업무에의 부담을 줄여 데이터 과학자가 더 창조적이고 도전적으로 작업할 수 있을 것이기 때문이다. 오늘날의 데이터 과학자 부족 현상에도 도움이 될 수 있다. ciokr@idg.co.kr 



2017.10.27

블로그 | AI, 데이터 과학자 업무에도 침투하다

James Kobielus | InfoWorld
데이터 과학에서 인간만이 담당할 수 있었던 업무를 수행하는 도구가 등장했다. 데이터 과학자라는 직업의 미래에도 경고 신호가 켜질지도 모른다.

인공지능의 발전하면서 일자리 위기가 발생할 것이라는 위기감이 고조되고 있다. 단순 업무 뿐 아니라 복잡한 사무직도 압박할 수 있는 능력이 속속 입증되고 있기 때문이다.

흔히 '자동화'라는 용어가 등장하는 이러한 논의에 있어 데이터 과학자조차도 직업 안정성에 대해 생각하기 시작했다. 필자는 최근 머신러닝 모델을 '운영화'(operationalizing)할 수 있도록 고안된 알터릭스(Alteryx)의 신규 도구에 대한 앤드류 브루스트의 글을 흥미롭게 읽었다.

그는 이 글에서 알터릭스의 도구가 데이터 과학 업무의 생산성을 높일 것이라고 언급하면서도 향후 여러 벤더가 다양한 수준의 자동화 도구를 공급할 가능성에 대해 제시했다. 데이터 과학 개발, 배치, 워크플로우 최적화 등의 업무가 점차 자동화되어갈 수 있다는 설명이다.

알터릭스의 도구가 제시하는 기능들에 대해 살펴보면 다음과 같다.

- 코드 없는 알터릭스 디자이너툴은 머신러닝 모델과 관련해 자동으로 커스터마이즈된 REST APIs와 도커 이미지를 생성한다.

- 알터릭스의 새로운 프로모트(Promote) 툴은 알터릭스 서버애널리틱스 플랫폼에서 실행을 위한 모델을 자동으로 배치한다. 참고로 이 툴은 알터릭스가 최근 Yhat을 인수하면서 확보한 데이터 과학 모델 관리 기술을 이용하고 있다.

- 프로모트는 애플리케이션 요구 사항의 변화에 따라 각 모델의 런타임 리소스 소비를 자동으로 조정할 수 있다.

- 디자이너 워크플로우는 머신러닝 모델을 자동으로 재훈련시키도록 설정될 수 있다. 새로운 데이터가 입력되면 프로모트에의 인터페이스가 그게 맞춰 재배치된다. 그러면 프로모트는 어떤 모델 버전이 현재 배치되어 있는지 추적해 모델 거버넌스를 자동으로 보장한다. 이로 인해 예측성을 보유한 모델이 늘 존재할 수 있게 된다.

부루스트는 그러나 현재로서는 데이터 과학 워크플로우에 있어 수동 작업을 줄이려는 노력이 '단점보다는 장점'이 많을 것이라고 언급했다. 실제로 오늘날 데이터 과학 작업에는 수많은 저수준 노동이 포함돼 있는 것이 사실이다.

필자 또한 데이터 과학에서 자동화의 위험성을 굳이 과장할 필요는 없다고 판단한다. 반복적인 업무에의 부담을 줄여 데이터 과학자가 더 창조적이고 도전적으로 작업할 수 있을 것이기 때문이다. 오늘날의 데이터 과학자 부족 현상에도 도움이 될 수 있다. ciokr@idg.co.kr 

X