Offcanvas

가상화 / 디지털 트랜스포메이션 / 비즈니스|경제 / 빅데이터 | 애널리틱스 / 신기술|미래

김진철의 How-to-Big Data | CPS와 Digital Transformation (2)

2021.01.26 김진철  |  CIO KR

소위 GAFA(Google, Amazon, Facebook, Apple)로 불리는 플랫폼 기업들의 성공을 벤치마크하고 기업 경영에 접목시켜 성장을 꾀하는 디지털 전환이 이 시대의 새로운 경영 마인드로 붐을 일으키고 있는 가운데, 이런 디지털 전환에서 빅데이터와 사이버 물리 시스템 기술의 중요성에 대해서 지난 시간에 소개한 바 있다. 

컬럼비아 대학교 비즈니스 스쿨의 데이빗 로저스 교수는 자신의 책 “디지털 전환 지침서(The Digital Transformation Playbook)”에서 디지털 전환을 크게 다섯 가지 차원(dimension)에서 보도록 조언하고 있다[2-3]. 이 다섯 가지 차원(dimension)은 고객, 경쟁, 데이터, 혁신, 가치인데, 여기서 데이터는 나머지 네 가지 차원에서 일어나는 디지털 전환 활동의 연료가 된다는 점에서 중요하다.

이렇게 다섯 가지 차원에서 일어나는 디지털 전환의 연료인 데이터를 생산, 가공하고 소비하는 기술로서 빅데이터 기술, 사이버 물리 시스템 기술과 체계는 디지털 전환의 신경계로서 역할을 하게 된다. 이런 사례 중 대표격인 버버리와 제너럴 일렉트릭의 디지털 전환 사례를 지난 마흔 여덟 번째 글에서 같이 살펴보면서 이 사례들이 주는 교훈에 대해서 생각해 보았다.

위 다섯 가지 차원과 함께 디지털 전환을 이끄는 중요한 요소로서 필자는 이번 글에서 “예측 분석(Predictive Analytics)”과 “미래 연구(Future Forecasting)”에 대해서 살펴보려고 한다. 
 

ⓒGetty Images


데이터를 이용한 과학적인 의사 결정을 적극적으로 수용하고, 이를 사이버 물리 시스템과 인프라로 자동화하여 비즈니스의 기민성과 확장성(scalability)을 높이는 디지털 전환이 되기 위해서는, 디지털 전환의 신경계가 적시, 적소에 배치되고 동작할 수 있도록 하는 기민하고 효과적인 의사 결정, 계획 과정이 필요하게 된다. 예측 분석과 미래 연구는 이렇게 사이버 물리 시스템 기반 지능형 서비스 비즈니스의 기민성과 확장성을 안정적으로 얻기 위한 의사 결정, 계획을 위해 필요한 요소이다. 

그럼 이제 사이버 물리 시스템을 이용한 지능형 서비스 비즈니스에서 이런 예측 분석과 미래 연구가 왜 필요한지에 대해 좀더 구체적으로 생각해보자.

첫번째로, 사이버 물리 시스템을 통해 정교하게 수집되어 비즈니스 대상과 환경에 대해 의미 있는 정보로 가공된 빅데이터를 이용해 적절하게 수행된 예측 분석은 비즈니스 성공에 영향을 줄 수 있는 위험 요소들과 불확실성을 줄여준다. 빅데이터를 이용한 예측 분석을 통해 기업은 이런 위험 요소들과 비즈니스와 관련된 시장의 불확실성에 대응할 수 있는 전략을 좀더 구체적으로 고민할 수 있고, 이런 전략을 준비하고 실행할 수 있는 시간을 벌 수 있다.

이렇게 빅데이터를 이용한 예측 분석을 이용해 비즈니스 위험 요소를 관리하고 불확실성에 대응하여 얻은 여유는 기업과 비즈니스를 좀더 안정적으로 만들 수 있고, 비즈니스의 예측 가능성을 높여 기업의 자원을 더 효과적으로 활용하고 낭비를 줄일 수 있게 한다. 

위와 같이 전사적 전략 수준의 예측 분석과 미래 연구의 효용도 분명하지만, 비즈니스 각 개별 요소에 적용되는 예측 분석들도 사이버 물리 시스템 기반의 지능형 서비스에서 중요한 역할을 한다. 예를 들어, 자율주행 배달 로봇을 이용한 음식 배달과 같은 사이버 물리 시스템 기반의 지능형 서비스 비즈니스를 한번 생각해보자. 

비즈니스가 어느 정도 성장하는 과정에서 각 자율주행 배달 로봇이 수집한 배달 경로와 주행 환경에 대한 데이터, 그리고 각 지역별로 수집된 배달 패턴과 배달 음식의 종류, 고객의 취향에 대한 데이터를 이용하여 이 데이터들이 보이는 패턴과 날씨, 인구 유동, 하루 중 시간대, 계절과의 관계를 분석하여 어느 정도 의미 있는 패턴을 찾아냈다고 가정해 보자.

이렇게 자율주행 배달 로봇과 배달 주문 시스템을 통해서 수집된 음식 배달 패턴과 고객 선호도에 대한 빅데이터를 이용해 하루 중 시간대별로 배달 로봇을 어느 정도 투입해서 운영해야 할지, 배달 시간을 최소한으로 하기 위해 하루 중 시간대별로 어떤 경로를 주 이동 경로로 해서 배달 로봇을 이동시켜야 할지, 계절과 날씨에 따라 어떤 음식이 많이 주문되는지에 관해 분석을 통해 예측 분석을 해볼 수 있을 것이다.

수집된 데이터를 기초로 한 예측 분석을 이용해 특정한 날씨와 계절에 따라 특정 시간대에 예상되는 음식 배달 주문의 수요를 예측하고 이를 기초로 해서 배달 로봇의 투입량과 경로를 계획할 수 있다면 배달 로봇을 운영하는데 드는 비용과 노력을 줄여 비즈니스 운영을 더 효율화할 수 있을 것이다. 이렇게 효율화된 자율주행 배달 로봇 운영과 음식 배달 서비스 때문에 음식 배달 시간과 배달 품질을 더 향상할 수 있게 되면 이는 서비스에 대한 고객 경험 향상과 비즈니스 성장의 가속으로 이어지게 될 것이다.

앞서 살펴본 자율주행 배달 로봇을 이용한 음식 배달 서비스와 같은 경우에서 간단하게 살펴보았듯이, 전사적, 거시적 비즈니스 예측 분석 모델도 중요하지만, 비즈니스를 구성하는 각 요소, 앞서 든 예에서는 자율주행 배달 로봇의 경로 계획 및 투입량 산정과 같은 개별 요소에서도, 예측 분석 모델은 사이버 물리 시스템의 해당 개별 사이버 요소의 두뇌로서 동작하여 비즈니스 지능화에 기여하게 된다.

두 번째로, 예측 분석과 미래 연구는 새로운 비즈니스를 설계, 계획하고 실행하거나, 이미 수행하고 있는 비즈니스를 확장하는 데에도 중요한 역할을 한다. 

빅데이터 비즈니스 조직을 꾸리는데 중요한 것중의 하나가, 자원 계획을 효과적으로 수립하고 투입을 신속하게 실행할 수 있는 조직 체계를 갖추는 것이라고 스물 두번째 글에서 CERN의 LHC 실험 운영 거버넌스 체계를 살펴보면서 말한 바 있다[2]. 

빅데이터 비즈니스 조직에서 이런 자원 계획과 실행에 효과적인 거버넌스 체계를 갖추는 것이 중요한 이유는 빅데이터 비즈니스를 위해서는 경우에 따라 많은 자원이 투입되어야 할 수 있고, 이런 자원 투입이 적절하게 되지 않으면 비즈니스의 성공이 위협받을 수 있기 때문이라고 설명하였다[4].

예측 분석과 미래 연구가 사이버 물리 시스템 기반의 지능형 서비스 비즈니스에서 중요한 이유도 이런 비즈니스 자원 계획 수립 및 실행에 밀접한 연관이 있다. 비즈니스 모델을 설계, 기획하는 단계에서 빅데이터 기반의 예측 분석과 미래 연구가 중요하기도 하지만, 비즈니스 모델이 이미 어느 정도 실행되고 있는 과정에서 앞으로의 비즈니스 성장과 확대, 비즈니스 모델 전환과 출구 전략 수립, 실행을 위해서도 예측 분석과 미래 연구는 중요하다.

5G를 비롯한 무선 통신으로 통합된 사이버 물리 시스템은 그 스케일이 일반 사무실 규모부터 지리적으로 광범위한 영역에 걸친 전국, 또는 전 지구적 스케일의 글로벌 서비스에 이르기까지 서비스의 특성과 요구되는 비즈니스 확장성의 규모에 따라 투입되는 자원과 시간, 비용이 크게 차이가 나게 된다. 

예를 들어 자율주행 로봇 택시 서비스가 만약 지금의 버스, 택시와 같은 지역 중심의 비즈니스 수행 기업에 의해 실행되는 경우와, 우버(Uber)와 같은 글로벌 비즈니스를 추구하는 기업에 의해 실행되는 경우는 비즈니스 실행을 위해 필요한 자원 투입의 규모와 실행 난이도에 큰 차이가 있다.

우버(Uber)와 같은 글로벌 기업이 다국적 법인을 설립하여 글로벌 비즈니스로서 로봇 택시 서비스를 운영하고, 이런 로봇 택시 서비스가 각 국가별로 구축된 데이터 센터와 지역 무선 통신 사업자를 통한 통신 인프라를 아울러 통합하면서 글로벌 비즈니스 운영, 관리를 위한 본사 데이터센터의 사이버 물리 시스템과 통합하여 운영해야 하는 수준이라면, 아주 작은 위험요소나 낭비요소 하나로 인해 수백억, 수천 억원의 예산을 연간 더 쓰거나 낭비할 수도 있다.

이렇게 다양한 계층의 ICT 인프라와 서비스를 통합하고, 여기에 글로벌 스케일의 비즈니스 로직과 시스템을 구현한 사이버 물리 시스템과 비즈니스 정보 시스템을 이용한 지능형 비즈니스에서는 가능하면 위험요소와 시장의 불확실성을 최대한 줄이고 없애는 것이 기업 운영의 효율성과 성장을 위해서 중요하다. 

우리나라 전국을 대상으로 하거나, 전 세계를 상대로 사이버 물리 시스템을 이용한 글로벌 비즈니스를 계획하고 실행해야 하는 경우라면 가능한 위험요소와 불확실성에 대한 무지를 최소한으로 줄이고 대응 전략을 수립하는데 예측 분석, 시뮬레이션, 시나리오 플래닝과 같은 미래 연구를 적극적으로 활용할 필요가 있다. 이런 측면에서 빅데이터, 사이버 물리 시스템을 이용한 예측 분석과 미래 연구는 디지털 전환에서 중요한 한 요소가 되어야 한다.

세 번째로, 새롭게 기획하여 실행에 옮기려고 하는 비즈니스 모델과 이를 위한 실행 계획이 적절한 수준으로 계획되었는지 실행전에 점검하고 평가하기 위한 방법으로 예측 분석과 미래 연구를 적극적으로 활용할 필요가 있다.

디지털 전환의 성공적이고 대표적인 사례로 꼽히는 아디다스의 스피드팩토리(SpeedFactory) 자동화 공장은 지난 2020년 4월을 기점으로 운영을 종료하였다[5-8]. 2016년에 독일 안스바흐와 미국 애틀란타의 두 곳에 구축되어 운영되었던 스피드팩토리는, 약 160여명의 소수 인원으로 일부 공정을 제외하고는 로봇을 이용한 완전 자동화를 통해 제조 시간을 단축하고 고객의 필요(needs)에 맞는 신발을 적시에 만들어 납품하려 하였다. 

이와 함께 지금까지 아시아의 저렴한 노동력을 이용해 신발을 생산한 후 선박과 비행기로 소비자에 전달하는 과정에서 생겼던 물류 비용을 소비자에 가까운 분산된 공장에서 제조하는 방식으로 줄여 제조 공정과 물류 프로세스를 혁신하려 하였다.

이렇게 완전 자동화와 분산 생산 방식을 통해 생산, 물류 비용을 절감하고 소비자의 기호에 맞는 더 나은 신발을 생산하려던 아디다스의 시도는 2020년 4월을 기점으로 일단 끝나게 되었다. 그렇지만, 이 시도를 통해 아디다스는 많은 값진 교훈을 얻었다.

첫 번째로, 신발과 옷과 같이 트렌드에 민감한 패션 상품들은 수시로 바뀌는 트렌드에 대응하여 신속하게 디자인을 수정하고 트렌드가 유효한 시점에 적절한 양의 제품을 신속하게 납품해야 하는데, 이 과정에서 제조비용을 절감하는 것은 단순히 인건비만을 낮춘다고 해결되는 것이 아니었다. 신발 제조 프로세스의 단계가 많고 복잡할수록 신발의 디자인을 변경하고 반영하는 과정이 오래 걸리고 복잡해져 비용이 상승한다는 것을 아디다스에서 미처 파악하지 못한 것이다.

산업용 로봇과 컴퓨터 비전 기술을 이용해 자동화되었던 스피드팩토리는 아시아의 노동력이 손으로 만드는 신발 제조 공정에 비해 단계가 많고 디자인 변경에 따른 재구성(reconfiguration)과 프로세스 변경이 어려웠다. 

트렌드에 따라 바뀌는 고객의 취향에 대응하여 변경된 디자인을 반영한 신발을 생산하기 위해 모든 제조 과정에 있는 컴퓨터 비전 소프트웨어와 로봇의 파라미터들을 새롭게 조정하고 설정해서 제조 프로세스를 재조정하는 것이 필요했다. 이런 재조정 과정이 생각보다 쉽지 않고 시간이 걸려 비용 절감과 제조 시간 단축의 효과가 생각보다 크지 않았던 것으로 알려졌다[7-8].

반면 아시아에 있는 신발 제조 공장에서는 신발을 만드는 숙련된 생산 인력들이 바뀐 디자인에 맞게 다시 만들기만 하면 되어 제조 공정이 로봇으로 자동화된 공장에 비해 매우 단순했기 때문에 디자인 변경에 따른 비용과 시간이 크게 들지 않았다. 바로 이 점 때문에 로봇으로 완전 자동화된 공장이 신발이나 옷과 같은 패션에 민감한 상품 생산에는 적절치 않았던 것이다[7-8].

두 번째로, 지구 온난화로 인해 환경운동가들과 소비자들이 기업들의 탄소 배출에 민감해지기 시작하면서, 아디다스가 스피드팩토리를 통해 소비자에 가까운 곳에서 분산된 방식으로 신발을 생산하려던 생각이 앞으로 제조업 분야 기업들에게 맞는 방식임이 확인된 것이다.

현재 제조 기업들이 공장 운영에서 배출하는 이산화탄소는 전체 배출량의 약 8% 정도지만, 공장에서 만든 제품을 소비자에게 전달하기 위해 운반하는 물류 과정에서 배출되는 이산화탄소는 전체 배출량의 약 14% 정도로 제조 과정에서 배출되는 이산화탄소에 비해 크게 높다. 이 물류 과정에서 배출되는 이산화탄소중 상당 부분이 비행기를 통해 운송되는 물류 과정에서 나온다고 한다[7].

이 때문에 잘 알려진 패션 브랜드인 “휴고 보스(Hugo Boss)”와 “파타고니아(Patagonia)”는 비행기로 운송하던 제품들을 상당 부분 배나 기차로 운송하는 방식으로 바꾸겠다고 최근 밝힌 바 있다[7]. 이런 물류 방법의 변경 때문에 당분간은 상품의 배송 기간이 길어져 물류 비용이 증가하고 소비자들을 떠나게 하여 단기 실적은 낮아지고 손해를 볼 수 있지만, 장기적으로 환경 운동 활동가들과 지구 온난화 이슈에 민감해지는 소비자들의 지지를 얻어 회사에 이익이 될 것임은 점점 분명해지고 있다. 

이렇게 민감해지는 지구 온난화 트렌드를 반영하여 인도 정부는 자국내에서 소비되는 제품을 인도내에 공장을 세우고 생산하는 다국적 기업의 경우 세금을 17%까지 인하해주겠다고 발표한 바 있다[7]. 이렇게 앞으로 점점 중요한 이슈가 되어 가고 있는 지구 온난화와 탄소 배출권 문제로 각국 정부가 자국 내 공장에서 제품을 생산하도록 하여 탄소 배출량을 줄이도록 유도하는 정책을 펴게 되면 아디다스가 소비자와 가까운 곳에서 분산된 방식으로 제품을 생산하려던 스피드팩토리 실험의 의도가 적절한 전략임이 증명된다.

소비자와 가까운 곳에서 제품을 소품종, 다양화된 제품을 분산된 방식으로 생산해서 물류 비용과 탄소 배출을 줄이는 것은 미래를 내다본 아디다스의 적절한 전략임이 분명하다. 그러나, 트렌드가 자주 바뀌어 제품의 디자인 변경이 잦은 신발과 같은 상품에 대해서는 로봇과 장비들을 변경된 디자인에 맞게 재조정하고 변경하는 작업에 많은 비용이 들 수 있기 때문에 로봇과 인공지능 기술을 이용한 신발 제조 공정의 자동화가 맞지 않을 수 있음은 아디다스가 미처 생각하지 못한 점이다.

위와 같은 제품 디자인 변경에 따른 자동화 공정 변경 비용의 증가는 사실 디자인 변경에 따른 프로세스 변경을 시뮬레이션해보면 어느 정도 파악할 수 있는 문제였다. 최근 프로세스 최적화 및 관리 분야의 지식과 연구도 많이 진보하였고, 근래 급격하게 향상된 컴퓨터의 연산 능력을 이용하면 스피드팩토리 수준의 프로세스를 컴퓨터로 모의 시뮬레이션하고, 디자인 변경에 따른 프로세스 재조정과 변경 과정에 드는 비용을 추정하지 못할 정도는 아니다. 

이와 함께 스피드팩토리 공장 건설 당시 자동화에 사용할 인공지능 기술과 이를 통해 자동화된 프로세스의 수준이 당시 인공지능 기술과 자동화된 프로세스가 실제로 할 수 있는 수준에 비해 높게 평가되었을 가능성이 높다.

아마 스피드팩토리 건설 초기에는 변경된 제품 디자인을 “컴퓨터 지원 설계(Computer-Aided Design; CAD)” 표준 형식으로 디지털 자료화하여 자동화된 공정에 넣어만 주면 자동화 단계의 각 기계에 탑재된 소프트웨어가 이렇게 디지털 자료로 전달된 디자인 파일을 읽어 쉽게 디자인 변경이 가능할 것이고, 생산 프로세스 변경에 드는 노력도 소프트웨어의 파라미터 변경 정도로 간단할 것이라고 생각했던 것 같다. 하지만, 실제 변경된 파라미터를 이용해 프로세스 전체의 통합을 조율하고 재조정하는 작업에 생각보다 많은 수작업과 시행착오가 발생했을 것이다.

아디다스의 스마트팩토리 실험은 기업 경영에 지구 온난화와 환경 정책이 미치는 영향이 커질 것을 미리 내다보고 소비자에 가까운 지역에 공장을 분산 건설하여 소품종, 맞춤형 제품 생산을 통해 성장의 기회를 만들어보려던 미래를 내다본 탁월한 혜안이었다. 

그렇지만 프로세스 시뮬레이션과 자동화 기술 수준에 대한 냉정한 평가가 있었다면 겪지 않았을 수 있었던 시행착오를 겪은 것은 다소 아쉽다. 이렇게 전략적인 선택이 적절하고 실현 가능성이 있는지, 그리고 전략의 구체적인 실행 과정에서 예상치 못한 다른 문제가 발생할 가능성이 없는지와 같은 문제들을 예측 분석과 미래 연구를 통해서 분석해서 그 위험과 파급 효과를 한층 경감시킬 수 있다.

성공하는 디지털 전환(DT)을 위한 예측 분석과 미래 연구
제너럴 일렉트릭의 사례에서 본 것처럼, 예측 분석을 이용한 예측 유지보수(predictive maintenance) 기법은 최근 중장비나 기계, 인프라 분야에서 장비와 인프라의 수명을 늘이고, 안전을 높이기 위한 기법으로 많은 관심을 받고 있다. 이렇게 예측 분석의 응용 분야가 확산되면서 예측 분석의 효용은 더 높아질 것이다.

그럼 일반 기업이 디지털 전환을 성공적으로 달성하기 위해서 이런 예측 분석과 미래 연구, 미래 예측에 사용할 수 있는 방법들이 어떤 것들이 있고, 어떻게 활용하는 것이 좋을까?

요즘 독자분들은 “예측 분석”이라는 말을 들으면 아마 기계 학습과 딥러닝을 가장 많이 떠올릴 것 같다. 예측 분석의 대상이 되는 시스템이 모든 변수를 완전하게 찾아낼 수 있을 만큼 잘 연구, 이해되지 않은 시스템이거나, 대상 시스템에 영향을 주는 변수가 워낙 많아 이 변수들을 모두 계산할 수 없을 경우에는 기계 학습 모델이 적절할 수 있지만, 사실 통계적 기계 학습 기반의 예측 분석 모델이나 딥러닝 기반의 예측 분석 모델은 분석용으로는 그렇게 적합하지 않은 예측 분석 방법론이다.

통계적 기계 학습을 위해 가정하는 통계적, 확률론적 모델들은 대상이 되는 시스템의 모든 변수를 고려하는 것이 아니라 대상 시스템의 행동(behavior)에 가장 크고 주된 영향을 주는 파라미터를 중심으로 확률 모델을 이용해 그 행동을 기술하고, 다른 변수의 영향이나 미처 고려할 수 없었던 외부 환경의 영향을 특정한 통계적, 확률론적 특성을 만족하는 잡음(noise)으로 취급하여 모델링하는 것이다. 

사실 이런 통계적, 확률론적 모델들은 대상에 대한 지식과 이해도가 낮지만 대상의 행동에 큰 영향을 주는 요인이나 변수를 어렴풋이 알 경우에 사용하는 근사적인 방법으로, 대상의 행동을 면밀하게 분석하고 살피기에는 많이 부족하다.

기본적으로 예측 분석에 가장 많이 사용되어 왔고 역사가 오래된 방법론은 “결정론적 모델(deterministic model)”을 사용하는 것이다. 이런 “결정론적 모델(deterministic model)”의 대표적인 것이 바로 물리학과 공학에서 많이 쓰이는 상미분 방정식(ordinary differential equation)과 편미분 방정식(partial differential equation)을 이용한 수치 모델들이다.

이런 “결정론적 모델(deterministic model)”들은 예측 분석의 대상이 되는 시스템의 행동을 기술하기 위해 뉴턴 역학의 철학적인 배경을 많이 채용하고 있다. 뉴턴 역학은 기술하려는 대상의 초기 상태와, 이 대상의 운동, 또는 변화 양상을 기술하는 방정식, 그리고 이 방정식의 해를 특징지어주는 경계 조건(boundary condition)만 주어진다면 이를 이용해 앞으로 대상이 어떤 식으로 움직이고 변화해갈지 모두 계산해낼 수 있다는 것이 핵심이다.

17세기 과학 혁명과 수학, 물리학의 발전 이래 자연과 사회의 주요 대상을 기술하기 위해 가장 많이 쓰여온 방법론이 바로 이 “결정론적 모델(deterministic model)”이다. “결정론적 모델(deterministic model)”은 예측 분석에 이용하기도 가장 용이하고, 역사가 오래된 만큼 이런 “결정론적 모델(deterministic model)”로 기술되는 자연계, 공학 시스템에 대한 지식도 많이 축적되어 왔기 때문에 그 만큼 많이 활용되고 있다.

이 “결정론적 모델(deterministic model)”에 미분 방정식이 많이 쓰이기는 하지만, 꼭 미분 방정식으로만 표현될 수 있는 것은 아니다. 미분 방정식이든, 대수 방정식이든, 그 해를 계산할 때 같은 조건에서 같은 답으로 귀결되는 모델이기 때문에 예측 분석과 해석에 매우 용이한 모델이기도 하다.

이 “결정론적 모델(deterministic model)”의 단점은 분석과 모델링의 대상이 되는 시스템을 정확하게 기술하는 요인(factor)과 변수(variable)을 찾아내고 확인하는데 많은 시간과 시행 착오, 노력이 필요하다는 것이다. 

과학적, 공학적으로 가장 잘 알려진 방정식이면서 전자기장(electromagnetic field) 시스템의 행동을 예측하는데 많이 사용되는 “맥스웰의 방정식(Maxwell’s Equation)” 같은 경우, 이 방정식의 주요 변수인 “전기장(Electric Field)”, “자기장(Magnetic Field)”의 실재를 확인하고 검증하는데 많은 시간이 걸렸다. 이 뿐만 아니라, 전자기장의 행동이 수학적으로 정리되어 맥스웰의 방정식으로 기술되고, 이 방정식의 해들이 발견되기까지 또 많은 시행 착오와 많은 사람들의 연구가 필요했다.

이와 같이 “결정론적 모델(deterministic model)”은 시스템을 구성하고 영향을 주는 요인들과 변수들, 이들 사이의 관계를 수학적으로 정리한 방정식을 실험을 통해 확인해 알고 있고, 이를 푸는 방법을 알고 있다면 예측을 정확하게 할 수 있다는 장점이 있다. 

하지만 이렇게 정확한 모델로 만들기까지 많은 시행 착오와 실험, 확인이 필요하기 때문에, 비즈니스 영역과 같이 대상의 행동에 영향을 주는 모든 변수를 파악하고 있지 못하거나, 알고 있다고 하더라도 이들 변수들 사이의 상호 관계를 모두 파악하지 못했거나 정확하게 알고 있지 못할 때에는 정확한 예측을 할 수 없다는 단점이 있다.

비즈니스에서 다루어야 하는 많은 문제들이 “결정론적 모델(deterministic model)”로 기술되고 예측되기에는 너무 복잡하고 잘 이해되지 않은 시스템이 많다. 이런 이유 때문에 실제 비즈니스를 위한 데이터 과학에서는 보기 힘든 예측 분석 방법론이기도 하다.

“결정론적 모델(deterministic model)”과 함께 데이터 과학에서 예측 분석에 많이 쓰이는 모델은 “확률 모델(probabilistic model)”과 “확률 과정 모델(stochastic model)”이다. 요즘 관심이 많은 기계 학습 모델과 딥러닝 모델은 이 “확률 모델(probabilistic model)”의 특별한 경우에 해당한다. 

“확률 모델(probabilistic model)”은 예측의 대상이 되는 시스템의 모든 상태가 특정한 확률 값을 가지는 “확률 변수(random variable)”로서 기술된다. 우리가 관심 있어 하는 예측 대상 변수 또한 확률 변수(random variable)로서 기술이 되며, 이 예측 대상 변수는 대상 시스템에서 다른 확률 변수들과의 관계, 대상 시스템에서 나타나는 잡음의 특성, 그리고 시스템의 동작 특성에 의존해서 결정되는 확률 분포에 따라 그 상태가 특정한 확률로써 나타나는 시스템으로 묘사된다.

“결정론적 모델(deterministic model)”에 비해 비즈니스와 복잡한 시장 예측 모델에 적용하기 쉽고, 미처 고려하지 못한 변수들의 영향은 잡음(noise)의 형태로 모델에 포함시켜 모든 변수들의 영향을 명시적으로 고려하지 않고도 대상 시스템을 모델링하고 예측 분석을 수행할 수 있다. 이 때문에 이 확률 모델과 확률 과정 모델은 비즈니스 모델링에 많이 쓰인다.

이 확률 모델의 확률 변수가 따르는 확률 분포를 결정하기 위해, 측정된 데이터를 이용해 대상 시스템이 따를 것이라고 가정한 확률 분포의 파라미터를 추정(estimate)하게 되는데, 최근 많이 알려진 기계 학습이나 딥러닝 모델의 학습과정도 바로 이 확률 분포의 파라미터 추정으로서 기술되게 된다. 

이처럼 대상에 대한 정확한 지식 없이, 대상에 영향을 미치는 요인과 변수가 어떤 것인지만 알 수 있고, 대상에 영향을 주는 변수들 사이의 관계를 모두 정확하게 알고 있지 못할 때 확률 모델과 확률 과정 모델이 유용하게 사용될 수 있다.

측정한 데이터를 가장 잘 설명하는 확률 분포를 만드는 확률 분포 파라미터들을 추정해서 확률 모델을 만들어내면, 이 확률 모델을 이용해 측정된 상황이 아닌 다른 상황에서의 대상의 행동을 확률 모델을 이용해 예측해볼 수 있다.

이 확률 모델을 이용해 예측 분석의 대상이 되는 확률 변수의 값을, 몬테카를로 시뮬레이션과 같은 난수를 이용한 시뮬레이션을 통해서 얻게 되면 이것이 대상 시스템에 대한 예측이 되며, 이 모델에서 얻은 예측 데이터를 추가로 가공하거나 분석하여 예측 분석을 수행하게 된다.

확률 모델을 만족하는 확률 변수들이 특정한 수학적인 관계를 만족하면서 시간에 따라 변하는 상황을 기술하는 모델이 확률 과정 모델이 된다. 역시 이 확률 과정 모델 또한 비즈니스와 경제 시스템, 사회 시스템과 같은 복잡한 현상의 이해와 모델링에 용이하기 때문에 광범위한 영역에서 많이 활용되고 있다. 비즈니스를 위한 데이터 과학에서 예측 분석을 수행한다고 하면 대부분의 경우 이런 확률 모델과 확률 과정 모델을 활용하게 된다.

기계 학습이 예측 분석을 위한 고급 데이터 분석에 많이 활용되게 된 것은, 학습하는 기계를 위한 기계 학습의 이론을 주창한 초기 인공지능 기술 연구자들이 이런 기계의 학습 과정을 통계적 파라미터 추정(parameter estimation)의 과정을 빌어 형식화하여 이론으로 정립한 이유도 있다.

이와 같이 예측 분석의 대상이 되는 시스템이, 그것이 기계 부품이 되었건, 비즈니스 지표가 되었건, 아니면 복잡계로서 복잡한 행동을 보이는 변수의 영향을 크게 받는 경제 시스템, 시장, 주가 지표(stock market index)와 같이 비즈니스에 밀접한 시스템이 되었건 결정론적 모델이나 확률 모델, 확률 과정 모델로 근사하여 모델링할 수 있다. 이렇게 모델링된 대상을 앞으로의 행동과 예상되는 다양한 상황을 예측하고, 이에 대한 후속 분석을 다시 수행하는 방식으로 예측 분석을 수행하게 된다.

하나의 결정론적 모델이나 확률 모델, 확률 과정 모델로서 현재 당면한 비즈니스 문제에 대한 예측 분석이 온전하게 수행될 수 있다면 참 다행스러운 경우일 것이다. 그렇지만, 비즈니스 수행 과정에서 맞닥뜨리는 문제들 대부분이 이렇게 하나의 모델로서 분석될 수 있는 경우는 사실 많지 않다.

이뿐만 아니라 요즘 경제와 시장은 과거의 경제, 시장보다 그 움직임이 더 역동적이고 변화 무쌍하여 예측하기 어렵다. 시장만 그런 것이 아니라, 제조 기업이 만들어 공급하는 상품들도 과거의 상품에 비하면 훨씬 더 복잡한 제품으로 만들어진다. 

제품의 상태와 고장이나 장애를 선제적으로 예측해 예방할 목적으로 제품 자체에 대한 예측 분석을 수행하는 경우에도 이런 제품이 하나의 모델로서 이해되기 보다는 다양한 관점과 수준에서 여러 개의 모델을 같이 활용해 모델링하여 이해되는 경우가 많다.

자동차와 항공기와 같은 복잡한 기계들은 제품의 각 구성 요소와 통합 수준별로 다양한 수학적 모델에 의존해서 기술(describe)된다. 이런 복잡한 제조 상품들의 행동을 예측해서 불량이나 오작동, 장애를 예측하고 예방하기 위해서는 서로 엮인(coupled) 많은 수의 수학 모델과 상태 변수들을 동시에 풀어내어 전체 시스템의 행동을 예측해야 할 필요가 있다.

이런 의미에서 예측 분석을 위한 모델을 만드는 좁은 의미의 모델링뿐만 아니라, 시뮬레이션 기술과 인프라의 중요성이 디지털 전환에서 점점 더 높아지고 있다. 특히, 최근 전자장비와 임베디드 컴퓨터의 비중이 높아지고, 이들 전자 장비와 임베디드 컴퓨터에서 운영되는 수치 모델의 비중이 높아져가고 있는 제조업 상품들의 경우 이런 상품들의 행동을 흉내 내어 시뮬레이션하기 위해 많은 수의 모델을 서로 연관(couple) 지어 동시에 풀어내는 시뮬레이션 시스템이 필요하게 된다.

이렇게 제품 하나의 행동을 예측하기 위해 제품의 행동을 기술하는 다양한 수학 모델들을 다양한 수준과 관점에서 동시에 계산하여 풀어내어, 특정한 환경과 조건에서 제품의 행동과 상태를 정밀하게 재현하고 예측할 수 있도록 하는 고성능 시뮬레이션 기술이 점점 더 중요해지고 있다. 이런 고성능 시뮬레이션을 수행하기 위해서는 시뮬레이션에 들어가는 많은 데이터와, 시뮬레이션의 해를 구하기 위해 필요한 많은 양의 연산을 소화하기 위해 보통 고성능 병렬 컴퓨터를 사용하게 된다.

제품의 다양한 부품과 구성 요소들, 그리고 이런 구성 요소들이 통합된 완제품의 행동을 기술하는 수학 모델을 포함한 다양한 모델들이 실제 상황에서 대상 제품이 보여줄 수 있는 행동과 상태를 최대한 정밀하게 흉내내기 위해 슈퍼 컴퓨터 급의 계산을 동원하는 멀티 스케일(multi-scale), 멀티 물리(multi-physics) 시뮬레이션의 필요성이 점점 더 높아지고 있다. 이렇게 컴퓨터 상에서 시뮬레이션의 대상이 되는 제품이나 시스템의 상태를 목표로 하는 조건과 상황에서 최대한 정밀하게 계산하여 얻은 데이터를 이용해 다양한 예측 분석을 수행하게 된다.

이런 종류의 멀티 스케일(multi-scale), 멀티 물리(multi-physics) 시뮬레이션을 많이 활용하는 제조품들은 자동차와 항공기와 같이 오작동이 일어날 경우 인명 손실이 일어날 수 있는 미션-크리티컬한 기계나 장비 제품들이다. 

사고 상황과 비슷한 상황을 인위적으로 실험실에서 만들어서 제품이 받는 영향과 행동을 실험을 통해 분석하기도 하지만, 대개의 경우 사고 상황과 같은 돌발적이고 예외적인 상황에서 제품이 받는 영향과 제품의 행동을 정확하게 분석하는 것은 매우 어렵다.

이 때문에 제품이 제대로 동작할 수 없거나 심지어는 고장, 파괴될 수 있는 극단적인 상황에서도 인명을 보호하고 제품의 고장을 최소화할 수 있는 방법을 찾을 수 있도록 최근 정밀한 대규모 시뮬레이션 기술이 점점 더 중요해지고 있다.

이런 시뮬레이션에 쓰이는 개별 수치 모델, 확률 모델과, 이들 개별 모델들을 결합(couple)하여 복잡한 모델을 만들고, 이런 복잡한 모델을 이용해 제품을 시스템 수준으로 기술하는 정밀한 멀티스케일(multi-scale), 멀티물리(multi-physics) 시뮬레이션을 이용해 컴퓨터 상에서 제품의 상태를 정밀하게 재연하고 형상화할 수 있다. 이렇게 실제 제품의 상태를 컴퓨터 상에서 수학 모델을 이용해 정밀하게 재현하여 제품의 분석과 제어, 운영에 활용하는 것을 “디지털 트윈(Digital Twin)”이라고 한다.

이 “디지털 트윈(Digital Twin)”이라는 말을 처음 사용하기 시작한 것은 앞서 마흔 여덟번째 글에서 소개한 제너럴 일렉트릭이다. 

항공기 엔진이나 부품, 발전소의 터빈과 같은 미션-크리티컬한 부품과 산업용 장비를 생산하는 제너럴 일렉트릭이 이들 복잡한 장치들의 고장과 장애를 줄이고 시스템을 정밀하게 분석하기 위해 복잡한 대규모 시뮬레이션을 적극적으로 활용해 제품 동작의 예측 분석과 예측 유지보수(predictive maintenance)에 활용했는데, 자신들의 이런 프로세스와 시스템을 설명하는 용어로서 “디지털 트윈(Digital Twin)”이라는 용어를 고안해 사용하기 시작했다.
 

그림 1. 세계적인 자동차 제조 브랜드인 AUDI의 엔지니어들이 가상 현실과 "디지털 트윈(Digital Twin)" 기술을 이용하여 자동차 대시보드를 검증하고 있다. (그림 출처: https://audi-illustrated.com/en/smart-factory/Einleitung)


이 “디지털 트윈(Digital Twin)”을 이용한 예측 분석이 앞으로 제조업의 새로운 중흥을 이끌 예측 분석 방법론의 중요한 한 축이 될 것으로 필자는 보고 있다.

“디지털 트윈(Digital Twin)”을 구축하는 고성능 시뮬레이션 컴퓨팅 기술, 오랜 기간에 걸쳐 쌓인 제품과 생산 공정에 대한 지식과 경험을 다양한 수준에서 많은 수의 수학적 모델을 결합(couple)하여 복잡한 대형 시뮬레이션 모델로 만들어낼 수 있는 전문지식과 경험, 수학적 모델링 능력, 이런 “디지털 트윈(Digital Twin)”과 대형 시뮬레이션 모델이 실제 제품과 차이가 없도록 하기 위해 필요한 제품의 실제 행동 정보를 담은 데이터를 수집, 가공, 관리하는 시스템을 구축하고 제품과 통합할 수 있는 기술력은 보통의 기업이 쉽게 흉내낼 수 없는 제조 기업들의 새로운 경쟁력으로 자리잡게 될 것이다.
 

그림 2. ANSYS 시뮬레이션 소프트웨어를 이용해 플로우서브(FlowServe)사의 펌프 제품에 대한 디지털 트윈을 생성하고 이를 이용해 펌프의 결함을 분석한 사례. (위) PTC ThingWorx라는 산업용 사물 인터넷 플랫폼을 이용해 실제 운용중인 펌프로부터 데이터를 수집하고 이를 ANSYS 시뮬레이션 소프트웨어를 이용해 만든 디지털 트윈에 연계하는 방법을 설명한 그림. (아래) ANSYS 시뮬레이션 소프트웨어로 만들어진 디지털 트윈을 이용해 플로우서브(FlowServe)사의 펌프에 생긴 기포를 보라색으로 시각화하여 캐비테이션이 밸브 성능에 영향을 끼쳤으며, 이로 인해 진동 문제가 발생하였음을 확인한 사례. (그림 출처: [9])

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.