Offcanvas

AI / CIO / How To / 리더십|조직관리 / 빅데이터 | 애널리틱스 / 신기술|미래 / 통신|네트워크

김진철의 How-to-Big Data | 빅데이터의 미래 (2)

2019.12.30 김진철  |  CIO KR


사이버 물리 시스템(Cyber-Physical System)과 빅데이터의 관계
필자가 이번 글 초반에 현재 사회에 나타나는 기술 트렌드의 지향점을 설명하는 단어로 “사이버-물리 시스템(Cyber-Physical System)”을 소개하였을 때 사이버-물리 시스템이 빅데이터의 미래를 보여주는 단 하나의 정답이라고 얘기하지 않았음을 독자 여러분들께서는 잊지 않으셨으면 한다. 빅데이터 트렌드가 다른 기술 트렌드들과 융합하여 발전하는 방향을 현재 시점에서 가장 잘 설명하는 단어가 “사이버-물리 시스템(Cyber-Physical System)”이기 때문에 “사이버-물리 시스템(Cyber-Physical System)”을 좀더 구체적으로 살펴보게 된 것이라고 언급했던 것을 꼭 기억해 주셨으면 한다.

필자가 이렇게 조심스럽게 “사이버-물리 시스템(Cyber-Physical System)”에 대해서 소개하는 것은 빅데이터 트렌드 초반에 빅데이터 관련 몇몇 기술들이 빅데이터의 전부인 양 비치고, 이런 오해를 통해 빅데이터라는 말이 실체가 아닌 단순한 마케팅 용어로 전락하면서 현실을 정확하게 보지 못하게 했던 부작용이 이 “사이버-물리 시스템(Cyber-Physical System)”이라는 용어를 통해서 또다시 생겨나지 않기를 바라는 마음 때문이다. “사이버-물리 시스템(Cyber-Physical System)”이라는 말 자체를 내세우기보다는 “사이버-물리 시스템(Cyber-Physical System)”이라는 말 뒤에 숨어 있는 현상과 배경의 의미를 정확하게 이해하는 데 같이 집중하도록 하자.

앞에서 설명한 것과 같이 “사이버-물리 시스템(Cyber-Physical System)”에서는 다양한 스케일에서의 컴포넌트와 시스템 간의 통합으로 다시 하나의 거대한 “사이버-물리 시스템(Cyber-Physical System)”이 조직되며, 이렇게 다양한 계층에서의 시스템 통합이 각각의 목적을 달성하도록 전체 시스템이 동작하는 데 중요한 역할을 한다. 바로 이 지점에 “사이버-물리 시스템(Cyber-Physical System)”과 빅데이터가 긴밀한 관련을 가지고 발전하게 된다.

“사이버-물리 시스템(Cyber-Physical System)”에서 일어나는 다양한 스케일에서의 컴포넌트와 시스템 간의 통합은 전체 시스템이 의도했던 목적과 효용을 위한 거대한 시스템으로 일관성 있고 흠없이(seamlessly) 작동하도록 이루어져야 한다. 이런 다양한 스케일에서의 컴포넌트 간 통합과 조율을 위해 필요한 정보의 수집, 가공, 관리와 분석에 빅데이터 기술들이 필요하다.

먼저 데이터 수집 관점에서 “사이버-물리 시스템(Cyber-Physical System)”과 빅데이터와의 연관성을 생각해보자. 앞서 예를 들었던 커넥티드 자동차를 다시 같이 생각해보자.

커넥티드 자동차나 자율주행 자동차는 자동차 내부에서 생산되는 데이터도 엄청난 양의 빅데이터가 된다. 지능형 교통 시스템 CPS를 구성하는 하나의 구성요소인 커넥티드 자동차가 단위 CPS로서 엄청난 양의 빅데이터를 쏟아내는 것이다. 



커넥티드 자율주행 자동차의 경우 이런 빅데이터를 생산하는 주된 컴포넌트는 주행 환경 인지를 위한 센서들인데, 이들 센서에 고성능 엣지 컴퓨팅 디바이스가 사이버 컴포넌트로서 같이 통합되면서 엄청난 양의 빅데이터를 자동차 내부 네트워크에 쏟아내게 된다.
센서들이 쏟아내는 빅데이터뿐만 아니라, 이들 센서 빅데이터가 커넥티드 자동차의 주행에 필요한 정보로 변환되는 과정에서 생기는 파생 데이터도 빅데이터가 된다. 물론, 엣지 컴퓨팅의 도움을 빌어 파생 데이터의 양은 센서에서 원래 생산되었던 원시 데이터의 양보다는 그 양이 많이 줄어들고 정보도 많이 압축되겠지만, 센서에서 생산되었던 원시 데이터가 워낙 많기 때문에 그 양이 줄어들고 압축된다고 해도 여전히 무시할 수 없는 빅데이터가 될 수밖에 없다.

다음에는 이들 커넥티드 자동차 내부에서 생산되는 빅데이터뿐만 아니라, 커넥티드 자동차들과 교통 인프라, 5G 또는 6G의 미래 모바일 네트워크 인프라가 엮여 만들어지는 대규모 교통 CPS 관점에서 생산되고 순환되는 빅데이터에 대해서도 한번 생각해보자. 앞에서 커넥티드 자율주행 자동차 한 대의 내부에서 생산되는 데이터만도 하루에 4TB에 이를 것으로 예측했던 인텔의 2016년 전망이 사실대로 이루어진다고 가정하자. 이런 커넥티드 자율주행 자동차들이 수백 대, 수천 대, 또는 서울과 같은 대도시에서 수십만 대에서 수백만 대가 도시 전역에서 주행하고 있는 상황에서 이들이 쏟아내어 모바일 네트워크로 하루에 전송하는 데이터의 양은 엑사바이트(1TB의 10만 배, 즉 1018 바이트)에서 제타바이트(1TB의 10억 배, 즉 1021바이트)정도의 규모가 된다는 것은 간단한 곱셈으로도 확인할 수 있다.

최근 빅데이터의 생산 주기가 점점 더 짧아지고 있어서, 지난 2016년에서 2017년 동안 생산된 데이터가 인류가 지금까지 생산한 데이터의 90%에 달한다고 한다[17, 19-20]. 2020년에는 전 세계에서 한 해에 40제타바이트가 생산되고 이 데이터는 2005년에 생산된 데이터의 300배에 달하며, 현재 매일 생산되는 데이터는 2.3제타바이트(23억 테라바이트)에 달한다는 IBM의 통계도 있다[17-18, 20]. 2018년 발표된 IDC의 백서에 따르면 2025년 한 해에만 175제타바이트의 데이터가 생산된다고 하는데, 그 증가 속도는 기하급수적으로 증가하는 것을 볼 수 있다. 이런 기하급수적인 데이터 생산량 증가는 앞서 커넥티드 자율주행 자동차의 예에서 CPS의 다양한 스케일의 계층에서 생산되는 데이터양을 생각해보면 어느 정도 수긍할 수 있다.

“사이버-물리 시스템(Cyber-Physical System)”에서 빅데이터 문제의 원인을 같이 생각해보자. 먼저 CPS에서 빅데이터를 처리해야 하는 가장 큰 이유는 CPS에 통합되는 컴포넌트의 수, 시스템 행동양식의 복잡도, 네트워크로 통합되어 상호작용하는 단위 CPS의 수에 비례하여 전체 CPS의 복잡도가 기하급수적으로 증가하며, 이 복잡도가 증가할수록 다루어야 하는 데이터의 양과 속도도 증가하기 때문이다. 

현재 자동차에 들어가는 전자 제어 장치(ECU)의 수만 해도 차종에 따라 수십 개에 이르는데, 자율주행을 위한 다양한 센서와 차량에 커넥티비티(connectivity)를 제공하기 위한 통신 모듈, 그리고 5G 및 6G 모바일 네트워크를 통해 커넥티드 자동차에 제공될 다양한 서비스를 위한 인포테인먼트 시스템과 기타 지능형 기능을 지원하기 위해 전자 제어 장치(ECU)나 차량 내 컴퓨팅 모듈의 수는 점차 늘어날 전망이다. 

이들 전자 제어 장치나 차량 내 컴퓨팅 모듈들은 앞서 살펴보았듯이 그 성능이 지난 20년간 지속적으로 향상되어 엔비디아(Nvidia)사의 Jetson Xavier 임베디드 컴퓨터와 같이 소형 슈퍼컴퓨터급의 성능을 지닌 임베디드 컴퓨터도 현재 시장에 출시된 상황이다. 이렇게 복잡한 연산이 가능한 임베디드 컴퓨터가 차량에 쓰이게 될 경우 차량 내에서 처리, 가공되는 데이터의 양도 자연스럽게 늘어날 수밖에 없다. 반대로 이런 고성능의 임베디드 컴퓨터가 자동차에 쓰이게 된다는 것은 자동차 내에서 처리해야 할 데이터의 양이 그만큼 많아진다는 뜻이기도 하다.

미래의 C-V2X 네트워크와 지능형 교통 시스템에 우선적으로 접속하게 될 이동 수단은 자동차가 되겠지만, 자동차만이 미래의 지능형 교통 시스템을 사용하는 것은 아니다. 우리의 이동 수단은 앞으로 비행 택시나 자율 드론 택시, 하이퍼루프와 같은 초고속 열차, IoT 기능이 추가된 자전거, 오토바이 등의 이륜차, 공유 킥보드 등과 같이 다양화될 것이다. 이런 다양한 이동 수단이 사용자의 집부터 최종 목적지까지 이동 수단이 필요한 모든 영역에서 모빌리티 서비스를 제공하기 위해 C-V2X를 통해 정보를 공유하거나 상호작용하게 되기 때문에 서로 교환하고 처리해야 할 빅데이터의 규모, 속도, 종류가 기하급수적으로 증가하게 된다.

위와 같이 CPS 시스템 내외부의 복잡도, CPS 개체 간의 상호작용의 복잡도에 따라 이를 구현하기 위해 필요한 정보의 양도 급증하기 때문에 CPS에서 유독 빅데이터 이슈가 부각되는 것은 자연스러운 현상이다.

두번째로 “사이버-물리 시스템(Cyber-Physical System)”의 가장 큰 특징 중의 하나인 시스템의 “자율성”을 구현하고 유지하기 위해 사용되는 제어 피드백 루프 회로가 지속적인 데이터 스트림을 만들어 내기 때문이다. 

우리 주변을 둘러싼 시스템과 인프라가 “사이버-물리 시스템(Cyber-Physical System)”으로 전환되면서 지금까지의 임베디드 시스템이나 인프라에 비해 “자율성(autonomy)”의 정도가 더 높아지게 된다. “사이버-물리 시스템(Cyber-Physical System)”이 자율성을 가지고 움직일 수 있도록 하기 위해 CPS 자기 자신과 CPS가 동작하는 주변 환경에 대한 정보를 끊임없이 수집하고 이를 가공, 분석해서 시스템에 피드백을 주어 CPS 전체의 상태를 안정적으로 유지할 수 있어야 하는데, 바로 이런 특성 때문에 하나의 CPS 전 시스템에서 빅데이터 수집, 처리 및 가공, 저장, 관리, 분석의 모든 이슈가 나타나게 된다.

빅데이터의 최종 활용 목적이 데이터의 분석과 분석 결과를 활용하는 수준이라면 데이터가 가공되면서 그 양과 속도가 점진적으로 줄어들 것이다. 그렇지만, 빅데이터의 최종 활용 목적이 시스템의 자율성을 유지하기 위해 자신의 상태 정보와 외부 환경 정보를 끊임없이 지속적으로 가공하여 피드백 루프를 통해 CPS 시스템에 다시 피드백을 주는 시스템이라면 빅데이터 가공의 최종 단계인 CPS의 제어 시스템에 이를 때까지 빅데이터의 양과 속도가 항상 줄어들지는 않을 수 있다. 시스템의 복잡도에 따라서는 오히려 더 늘어날 수도 있게 된다.

CPS와 상호작용하는 객체가 사람일 경우에는 사람의 행동 양식과 상호작용 방식을 완전하게 예측할 수 없는 불확실성 때문에 CPS의 행동 양식이 더욱 복잡해져 CPS의 자율성을 유지하기 위해 더 많은 빅데이터가 발생할 수 있다. 

구체적인 예를 들자면, 자율주행 자동차가 C-V2X와 센서의 도움을 받아 차선을 변경하는 경우를 생각해보자. 차선 변경을 위해서는 자율주행 자동차가 차선을 변경하는 동안 주변의 차량이 자신의 진로에 끼어들지 않을 것이라고 예측되어야 하고, 이 예측하는 계산 시간을 포함해서 실제로 차선 변경을 실행하는 동안에도 여전히 주변 차 중에서 사람이 직접 운전하는 차들이 갑작스럽게 끼어들 경우에 대비하면서 자동차 제어계를 제어해야 한다. 이 과정에서 주변 차들과 교통 상황에 대한 다양한 시나리오에 대해 수시로 예측 분석을 해야 하는데, 이 예측 분석의 결과가 또한 데이터가 되고, 이 예측 분석의 결과에 따른 차선 변경 경로 계획 데이터가 차량 내부에서 관리되면서 또 다른 종류의 데이터를 발생시키게 된다. 

고려해야 할 시나리오의 수가 많아지면 많아질수록 생성되는 경로 데이터의 양도 많아지며, 이렇게 예측 분석을 통해 계산된 경로 계획 데이터는 센서 데이터를 수집, 가공한 데이터와는 다른 종류의 데이터이다. 이렇게 CPS의 사이버 컴포넌트에 의해 자동화된 분석이나 시뮬레이션 과정에서 생기는 데이터도 CPS가 생산하는 빅데이터의 큰 비중을 차지할 것이기 때문에 CPS에서 빅데이터 처리가 더욱 중요해질 수밖에 없다.

세번째로 CPS 특유의 계층 구조와 네트워크를 통해 여러 수준의 스케일에 걸쳐 일어나는 상호작용 때문에 빅데이터를 처리해야 할 필요성이 높아진다.

하부 계층의 단위 CPS가 네트워크로 또 다른 계층의 CPS를 구성하는 대규모 CPS의 경우 계층별로 생산, 처리되는 막대한 빅데이터에 더해 이들 단위 CPS 간에 상호작용을 위해, 계층 간 상호작용을 위해 가공되고 교환되는 데이터가 파생되어 추가로 생겨난다. CPS의 계층이 늘어나고 CPS 안에서 상호작용하는 단위 CPS의 숫자가 늘어나면 늘어날수록 기하급수적으로 데이터의 규모와 속도도 높아지게 된다.

이와 같이 CPS를 구성하고 참여하는 컴포넌트와 하위 계층의 CPS의 숫자가 증가하면서 CPS에서 생산되고 흐르는 데이터의 규모와 속도도 기하급수적으로 증가하기 때문에 CPS가 사회 곳곳에 확산되는 것은 새로운 차원의 빅데이터 문제를 해결해야 하게 되는 것이다.

사회에서 인간과 상호작용하는 객체와 시스템이 고도로 지능화되고 자율성을 얻으며, 물리적 구성요소의 안전한 작동을 위한 컴퓨팅, 네트워크 구성 요소의 통합과 조율이 더 긴밀하고 복잡하게 엮여 나가게 되면 빅데이터 기술을 활용해야 할 필요성은 더 높아지게 된다.

이들 CPS가 자율적으로 동작하도록 하기 위해서는 예전에 CPS가 아니었던 업무 시스템이나 인프라 시스템에서 시스템의 구성요소로서 일하던 인간의 역할을 도와 인간의 능력을 더 증강하고 좀더 긴밀하고 유기적으로 통합된 시스템으로서 CPS가 작동하게끔 할 필요가 있다. 이를 위해 인간의 지능이 CPS와 상호작용하는 과정을 좀더 흠없이(seamlessly) 연동하기 위해 데이터 과학자와 소프트웨어 엔지니어들이 해당 업무를 기계 학습, 인공지능 기술로 자동화, 개선하게 될 것이다. 이와 함께, CPS 내에서 인간이 맡은 역할을 증강할 수 있는 방법을 찾기 위해 CPS가 제공하는 데이터를 분석하고 인간의 인지, 판단 능력을 보조하는 사이버 컴포넌트의 모델과 모듈을 개발하게 될 것이다.

위에서 소개한 바와 같이 CPS의 확산은 빅데이터 기술을 좀더 높은 수준으로 활용해야 하는 사회적인 공감을 확산시켜 빅데이터 기술 전문가와 데이터 과학자의 수요를 증가시키게 될 것이다. CPS의 확산으로 빅데이터 기술이 어떤 모습으로 바뀌어 갈 것인지 좀더 나가보도록 하자. 

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.