사이버 물리 시스템(Cyber-Physical System)과 빅데이터의 관계
필자가 이번 글 초반에 현재 사회에 나타나는 기술 트렌드의 지향점을 설명하는 단어로 “사이버-물리 시스템(Cyber-Physical System)”을 소개하였을 때 사이버-물리 시스템이 빅데이터의 미래를 보여주는 단 하나의 정답이라고 얘기하지 않았음을 독자 여러분들께서는 잊지 않으셨으면 한다. 빅데이터 트렌드가 다른 기술 트렌드들과 융합하여 발전하는 방향을 현재 시점에서 가장 잘 설명하는 단어가 “사이버-물리 시스템(Cyber-Physical System)”이기 때문에 “사이버-물리 시스템(Cyber-Physical System)”을 좀더 구체적으로 살펴보게 된 것이라고 언급했던 것을 꼭 기억해 주셨으면 한다.
필자가 이렇게 조심스럽게 “사이버-물리 시스템(Cyber-Physical System)”에 대해서 소개하는 것은 빅데이터 트렌드 초반에 빅데이터 관련 몇몇 기술들이 빅데이터의 전부인 양 비치고, 이런 오해를 통해 빅데이터라는 말이 실체가 아닌 단순한 마케팅 용어로 전락하면서 현실을 정확하게 보지 못하게 했던 부작용이 이 “사이버-물리 시스템(Cyber-Physical System)”이라는 용어를 통해서 또다시 생겨나지 않기를 바라는 마음 때문이다. “사이버-물리 시스템(Cyber-Physical System)”이라는 말 자체를 내세우기보다는 “사이버-물리 시스템(Cyber-Physical System)”이라는 말 뒤에 숨어 있는 현상과 배경의 의미를 정확하게 이해하는 데 같이 집중하도록 하자.
앞에서 설명한 것과 같이 “사이버-물리 시스템(Cyber-Physical System)”에서는 다양한 스케일에서의 컴포넌트와 시스템 간의 통합으로 다시 하나의 거대한 “사이버-물리 시스템(Cyber-Physical System)”이 조직되며, 이렇게 다양한 계층에서의 시스템 통합이 각각의 목적을 달성하도록 전체 시스템이 동작하는 데 중요한 역할을 한다. 바로 이 지점에 “사이버-물리 시스템(Cyber-Physical System)”과 빅데이터가 긴밀한 관련을 가지고 발전하게 된다.
“사이버-물리 시스템(Cyber-Physical System)”에서 일어나는 다양한 스케일에서의 컴포넌트와 시스템 간의 통합은 전체 시스템이 의도했던 목적과 효용을 위한 거대한 시스템으로 일관성 있고 흠없이(seamlessly) 작동하도록 이루어져야 한다. 이런 다양한 스케일에서의 컴포넌트 간 통합과 조율을 위해 필요한 정보의 수집, 가공, 관리와 분석에 빅데이터 기술들이 필요하다.
먼저 데이터 수집 관점에서 “사이버-물리 시스템(Cyber-Physical System)”과 빅데이터와의 연관성을 생각해보자. 앞서 예를 들었던 커넥티드 자동차를 다시 같이 생각해보자.
커넥티드 자동차나 자율주행 자동차는 자동차 내부에서 생산되는 데이터도 엄청난 양의 빅데이터가 된다. 지능형 교통 시스템 CPS를 구성하는 하나의 구성요소인 커넥티드 자동차가 단위 CPS로서 엄청난 양의 빅데이터를 쏟아내는 것이다.
커넥티드 자율주행 자동차의 경우 이런 빅데이터를 생산하는 주된 컴포넌트는 주행 환경 인지를 위한 센서들인데, 이들 센서에 고성능 엣지 컴퓨팅 디바이스가 사이버 컴포넌트로서 같이 통합되면서 엄청난 양의 빅데이터를 자동차 내부 네트워크에 쏟아내게 된다.
센서들이 쏟아내는 빅데이터뿐만 아니라, 이들 센서 빅데이터가 커넥티드 자동차의 주행에 필요한 정보로 변환되는 과정에서 생기는 파생 데이터도 빅데이터가 된다. 물론, 엣지 컴퓨팅의 도움을 빌어 파생 데이터의 양은 센서에서 원래 생산되었던 원시 데이터의 양보다는 그 양이 많이 줄어들고 정보도 많이 압축되겠지만, 센서에서 생산되었던 원시 데이터가 워낙 많기 때문에 그 양이 줄어들고 압축된다고 해도 여전히 무시할 수 없는 빅데이터가 될 수밖에 없다.
다음에는 이들 커넥티드 자동차 내부에서 생산되는 빅데이터뿐만 아니라, 커넥티드 자동차들과 교통 인프라, 5G 또는 6G의 미래 모바일 네트워크 인프라가 엮여 만들어지는 대규모 교통 CPS 관점에서 생산되고 순환되는 빅데이터에 대해서도 한번 생각해보자. 앞에서 커넥티드 자율주행 자동차 한 대의 내부에서 생산되는 데이터만도 하루에 4TB에 이를 것으로 예측했던 인텔의 2016년 전망이 사실대로 이루어진다고 가정하자. 이런 커넥티드 자율주행 자동차들이 수백 대, 수천 대, 또는 서울과 같은 대도시에서 수십만 대에서 수백만 대가 도시 전역에서 주행하고 있는 상황에서 이들이 쏟아내어 모바일 네트워크로 하루에 전송하는 데이터의 양은 엑사바이트(1TB의 10만 배, 즉 1018 바이트)에서 제타바이트(1TB의 10억 배, 즉 1021바이트)정도의 규모가 된다는 것은 간단한 곱셈으로도 확인할 수 있다.
최근 빅데이터의 생산 주기가 점점 더 짧아지고 있어서, 지난 2016년에서 2017년 동안 생산된 데이터가 인류가 지금까지 생산한 데이터의 90%에 달한다고 한다[17, 19-20]. 2020년에는 전 세계에서 한 해에 40제타바이트가 생산되고 이 데이터는 2005년에 생산된 데이터의 300배에 달하며, 현재 매일 생산되는 데이터는 2.3제타바이트(23억 테라바이트)에 달한다는 IBM의 통계도 있다[17-18, 20]. 2018년 발표된 IDC의 백서에 따르면 2025년 한 해에만 175제타바이트의 데이터가 생산된다고 하는데, 그 증가 속도는 기하급수적으로 증가하는 것을 볼 수 있다. 이런 기하급수적인 데이터 생산량 증가는 앞서 커넥티드 자율주행 자동차의 예에서 CPS의 다양한 스케일의 계층에서 생산되는 데이터양을 생각해보면 어느 정도 수긍할 수 있다.
“사이버-물리 시스템(Cyber-Physical System)”에서 빅데이터 문제의 원인을 같이 생각해보자. 먼저 CPS에서 빅데이터를 처리해야 하는 가장 큰 이유는 CPS에 통합되는 컴포넌트의 수, 시스템 행동양식의 복잡도, 네트워크로 통합되어 상호작용하는 단위 CPS의 수에 비례하여 전체 CPS의 복잡도가 기하급수적으로 증가하며, 이 복잡도가 증가할수록 다루어야 하는 데이터의 양과 속도도 증가하기 때문이다.
현재 자동차에 들어가는 전자 제어 장치(ECU)의 수만 해도 차종에 따라 수십 개에 이르는데, 자율주행을 위한 다양한 센서와 차량에 커넥티비티(connectivity)를 제공하기 위한 통신 모듈, 그리고 5G 및 6G 모바일 네트워크를 통해 커넥티드 자동차에 제공될 다양한 서비스를 위한 인포테인먼트 시스템과 기타 지능형 기능을 지원하기 위해 전자 제어 장치(ECU)나 차량 내 컴퓨팅 모듈의 수는 점차 늘어날 전망이다.
이들 전자 제어 장치나 차량 내 컴퓨팅 모듈들은 앞서 살펴보았듯이 그 성능이 지난 20년간 지속적으로 향상되어 엔비디아(Nvidia)사의 Jetson Xavier 임베디드 컴퓨터와 같이 소형 슈퍼컴퓨터급의 성능을 지닌 임베디드 컴퓨터도 현재 시장에 출시된 상황이다. 이렇게 복잡한 연산이 가능한 임베디드 컴퓨터가 차량에 쓰이게 될 경우 차량 내에서 처리, 가공되는 데이터의 양도 자연스럽게 늘어날 수밖에 없다. 반대로 이런 고성능의 임베디드 컴퓨터가 자동차에 쓰이게 된다는 것은 자동차 내에서 처리해야 할 데이터의 양이 그만큼 많아진다는 뜻이기도 하다.
미래의 C-V2X 네트워크와 지능형 교통 시스템에 우선적으로 접속하게 될 이동 수단은 자동차가 되겠지만, 자동차만이 미래의 지능형 교통 시스템을 사용하는 것은 아니다. 우리의 이동 수단은 앞으로 비행 택시나 자율 드론 택시, 하이퍼루프와 같은 초고속 열차, IoT 기능이 추가된 자전거, 오토바이 등의 이륜차, 공유 킥보드 등과 같이 다양화될 것이다. 이런 다양한 이동 수단이 사용자의 집부터 최종 목적지까지 이동 수단이 필요한 모든 영역에서 모빌리티 서비스를 제공하기 위해 C-V2X를 통해 정보를 공유하거나 상호작용하게 되기 때문에 서로 교환하고 처리해야 할 빅데이터의 규모, 속도, 종류가 기하급수적으로 증가하게 된다.
위와 같이 CPS 시스템 내외부의 복잡도, CPS 개체 간의 상호작용의 복잡도에 따라 이를 구현하기 위해 필요한 정보의 양도 급증하기 때문에 CPS에서 유독 빅데이터 이슈가 부각되는 것은 자연스러운 현상이다.
두번째로 “사이버-물리 시스템(Cyber-Physical System)”의 가장 큰 특징 중의 하나인 시스템의 “자율성”을 구현하고 유지하기 위해 사용되는 제어 피드백 루프 회로가 지속적인 데이터 스트림을 만들어 내기 때문이다.
우리 주변을 둘러싼 시스템과 인프라가 “사이버-물리 시스템(Cyber-Physical System)”으로 전환되면서 지금까지의 임베디드 시스템이나 인프라에 비해 “자율성(autonomy)”의 정도가 더 높아지게 된다. “사이버-물리 시스템(Cyber-Physical System)”이 자율성을 가지고 움직일 수 있도록 하기 위해 CPS 자기 자신과 CPS가 동작하는 주변 환경에 대한 정보를 끊임없이 수집하고 이를 가공, 분석해서 시스템에 피드백을 주어 CPS 전체의 상태를 안정적으로 유지할 수 있어야 하는데, 바로 이런 특성 때문에 하나의 CPS 전 시스템에서 빅데이터 수집, 처리 및 가공, 저장, 관리, 분석의 모든 이슈가 나타나게 된다.
빅데이터의 최종 활용 목적이 데이터의 분석과 분석 결과를 활용하는 수준이라면 데이터가 가공되면서 그 양과 속도가 점진적으로 줄어들 것이다. 그렇지만, 빅데이터의 최종 활용 목적이 시스템의 자율성을 유지하기 위해 자신의 상태 정보와 외부 환경 정보를 끊임없이 지속적으로 가공하여 피드백 루프를 통해 CPS 시스템에 다시 피드백을 주는 시스템이라면 빅데이터 가공의 최종 단계인 CPS의 제어 시스템에 이를 때까지 빅데이터의 양과 속도가 항상 줄어들지는 않을 수 있다. 시스템의 복잡도에 따라서는 오히려 더 늘어날 수도 있게 된다.
CPS와 상호작용하는 객체가 사람일 경우에는 사람의 행동 양식과 상호작용 방식을 완전하게 예측할 수 없는 불확실성 때문에 CPS의 행동 양식이 더욱 복잡해져 CPS의 자율성을 유지하기 위해 더 많은 빅데이터가 발생할 수 있다.
구체적인 예를 들자면, 자율주행 자동차가 C-V2X와 센서의 도움을 받아 차선을 변경하는 경우를 생각해보자. 차선 변경을 위해서는 자율주행 자동차가 차선을 변경하는 동안 주변의 차량이 자신의 진로에 끼어들지 않을 것이라고 예측되어야 하고, 이 예측하는 계산 시간을 포함해서 실제로 차선 변경을 실행하는 동안에도 여전히 주변 차 중에서 사람이 직접 운전하는 차들이 갑작스럽게 끼어들 경우에 대비하면서 자동차 제어계를 제어해야 한다. 이 과정에서 주변 차들과 교통 상황에 대한 다양한 시나리오에 대해 수시로 예측 분석을 해야 하는데, 이 예측 분석의 결과가 또한 데이터가 되고, 이 예측 분석의 결과에 따른 차선 변경 경로 계획 데이터가 차량 내부에서 관리되면서 또 다른 종류의 데이터를 발생시키게 된다.
고려해야 할 시나리오의 수가 많아지면 많아질수록 생성되는 경로 데이터의 양도 많아지며, 이렇게 예측 분석을 통해 계산된 경로 계획 데이터는 센서 데이터를 수집, 가공한 데이터와는 다른 종류의 데이터이다. 이렇게 CPS의 사이버 컴포넌트에 의해 자동화된 분석이나 시뮬레이션 과정에서 생기는 데이터도 CPS가 생산하는 빅데이터의 큰 비중을 차지할 것이기 때문에 CPS에서 빅데이터 처리가 더욱 중요해질 수밖에 없다.
세번째로 CPS 특유의 계층 구조와 네트워크를 통해 여러 수준의 스케일에 걸쳐 일어나는 상호작용 때문에 빅데이터를 처리해야 할 필요성이 높아진다.
하부 계층의 단위 CPS가 네트워크로 또 다른 계층의 CPS를 구성하는 대규모 CPS의 경우 계층별로 생산, 처리되는 막대한 빅데이터에 더해 이들 단위 CPS 간에 상호작용을 위해, 계층 간 상호작용을 위해 가공되고 교환되는 데이터가 파생되어 추가로 생겨난다. CPS의 계층이 늘어나고 CPS 안에서 상호작용하는 단위 CPS의 숫자가 늘어나면 늘어날수록 기하급수적으로 데이터의 규모와 속도도 높아지게 된다.
이와 같이 CPS를 구성하고 참여하는 컴포넌트와 하위 계층의 CPS의 숫자가 증가하면서 CPS에서 생산되고 흐르는 데이터의 규모와 속도도 기하급수적으로 증가하기 때문에 CPS가 사회 곳곳에 확산되는 것은 새로운 차원의 빅데이터 문제를 해결해야 하게 되는 것이다.
사회에서 인간과 상호작용하는 객체와 시스템이 고도로 지능화되고 자율성을 얻으며, 물리적 구성요소의 안전한 작동을 위한 컴퓨팅, 네트워크 구성 요소의 통합과 조율이 더 긴밀하고 복잡하게 엮여 나가게 되면 빅데이터 기술을 활용해야 할 필요성은 더 높아지게 된다.
이들 CPS가 자율적으로 동작하도록 하기 위해서는 예전에 CPS가 아니었던 업무 시스템이나 인프라 시스템에서 시스템의 구성요소로서 일하던 인간의 역할을 도와 인간의 능력을 더 증강하고 좀더 긴밀하고 유기적으로 통합된 시스템으로서 CPS가 작동하게끔 할 필요가 있다. 이를 위해 인간의 지능이 CPS와 상호작용하는 과정을 좀더 흠없이(seamlessly) 연동하기 위해 데이터 과학자와 소프트웨어 엔지니어들이 해당 업무를 기계 학습, 인공지능 기술로 자동화, 개선하게 될 것이다. 이와 함께, CPS 내에서 인간이 맡은 역할을 증강할 수 있는 방법을 찾기 위해 CPS가 제공하는 데이터를 분석하고 인간의 인지, 판단 능력을 보조하는 사이버 컴포넌트의 모델과 모듈을 개발하게 될 것이다.
위에서 소개한 바와 같이 CPS의 확산은 빅데이터 기술을 좀더 높은 수준으로 활용해야 하는 사회적인 공감을 확산시켜 빅데이터 기술 전문가와 데이터 과학자의 수요를 증가시키게 될 것이다. CPS의 확산으로 빅데이터 기술이 어떤 모습으로 바뀌어 갈 것인지 좀더 나가보도록 하자.
Surfshark
VPN (가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인 정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.