AI / 데브옵스 / 머신러닝|딥러닝 / 보안 / 빅데이터 | 애널리틱스 / 신기술|미래

투명성이 만병통치약?··· 블랙박스 AI의 위험을 완화하는 방법

2020.01.06 James Kobielus | Computerworld

머신러닝의 의사결정 과정을 이해할 수 없다면 이를 어떻게 신뢰할 수 있을까? 하지만 그렇다고 해서 설명 가능한 인공지능(XAI)이 모든 불안을 없애 줄까? AI 투명성이 모든 문제를 해결하는 만병통치약은 아니다. 머신러닝 모델의 투명성이 증가하면 AI에 대한 신뢰도 높아지겠지만, 이와 함께 위험도 따라온다.

기업이 머신러닝에 거는 기대가 매우 크다. 그러나 AI의 핵심인 머신러닝은 기업의 법률 및 보안 전문가를 당혹스럽게 만들고 있다.

AI를 둘러싼 가장 큰 우려 중 하나는 머신러닝 기반 모델이 ‘블랙박스’로 작동한다는 점이다. 다시 말해 머신러닝 모델, 특히 인공 신경망으로 구성된 딥 러닝 모델이 너무 복잡하고 난해해서 AI 설계자조차 자동화된 추론이 어떻게 도출되는지를 이해하기 어렵다. 이로 인해 머신러닝 기반 애플리케이션의 자동화된 결정이 낳은 편향과 여타 부적절한 결과에 대한 책임 소재가 모호해질 수 있다.

이런 위험을 완화하기 위해 사람들은 머신러닝이 작동하는 방식 그리고 머신러닝 모델이 개발, 학습, 배치되는 워크플로 전체에 걸쳐 투명성이 높아져야 한다고 주장하기 시작했다. 알고리즘 투명성은 설명 가능성, 해석 가능성, 책임성이라고도 알려져 있다. 현직 데이터 과학자들 사이에서 알고리즘 투명성을 위한 새로운 프레임워크가 도입되고 있다. 대표적으로 라임(LIME), 샤플리(Sharpley), 딥라이프트(DeepLIFT), 스케이터(Skater), AI 익스플레인너빌리티 360(AI Explainability 360), 왓-이프 툴(What-If Tool), 액티베이션 아틀라스(Activation Atlases), 인터프리트ML(InterpretML), 룰렉스 익스플레인너블 AI(Rulex Explainable AI) 등이 있다.

이러한 툴과 기법은 데이터 과학자가 여러 조건 하에서 특정 데이터 입력이 특정 알고리즘적 해석을 어떻게 도출하는가에 대한 ‘사후적 설명(post-hoc explanations)’을 생성할 수 있도록 지원한다. 사후적 설명은 결과를 보고 나서 현상을 분석하는 것을 말한다. 그러나 최근 이러한 프레임워크가 해킹될 수 있다는 연구가 있었다. 따라서 프레임워크가 생성한 사후적 설명의 신뢰성이 떨어질 수 있으며, 기업은 아래와 같은 위험에 노출될 수 있다.

위험 1. 알고리즘을 조작해 공개 기록에 침투할 수 있다
악의적인 사람들이 머신러닝 모델에서 형성된 편향을 잘못 전달하거나 모호하게 만들 목적으로 프레임워크가 생성한 설명을 해킹할 수 있다. 다시 말해 섭동(perturbation)을 기반으로 한 라임이나 샤플리 같은 접근법을 조작해 명백한 편향에 관해 악의 없는 사후적 설명을 생성할 수 있다.

위험 2. 기술 취약점이 부지불식간에 드러날 수 있다
머신러닝 알고리즘의 작동원리에 대한 정보를 모두 노출한다면 이를 노린 적대적 공격에 더 취약해질 수 있다. 이를테면 해커가 머신러닝 모델의 추론 방식을 조작하거나, 학습 단계에서부터 허위 데이터를 주입해 처음부터 악영향을 주는 공격을 할 수 있다.

위험 3. 지적 재산권 절취가 쉬워질 수 있다
전체 머신러닝 알고리즘과 훈련 데이터 세트를 설명하는 것만으로도 지적 재산권을 도둑맞을 수 있다. API와 여타 기능을 통해서도 마찬가지다. 머신러닝 모델의 작동 방식에 대한 투명한 설명으로 인해 제3자가 기반 모델을 무단 도용할 수 있다. 이와 비슷하게 훈련 데이터 세트 역시 부분적으로 혹은 전체적으로 재구성될 수 있다. 이를 모델 전도(Model Inversion) 공격이라고 한다.

위험 4. 프라이버시 침해가 만연해질 수 있다
제3자가 머신러닝 모델의 학습 데이터 세트에서 특정 개인의 데이터가 포함돼 있는지 무단으로 확인할 수도 있다. ‘회원 추론 공격(membership inference attack)’으로 알려진 이 적대적 공격 기법에 의해 해커는 상당한 양의 프라이버시 데이터에 접근할 수 있다.

---------------------------------------------------------------
인공지능에 대한 우려 인기기사
->AI에 제동을 걸어야 하는 6가지 이유
->AI가 판결하는 '정의란 무엇인가'
->AI의 '블랙박스'를 어디까지 신뢰할 수 있을까?
-> AI가 정신줄을 놓으면?··· 오싹하면서도 흥미로운 10가지 이야기
->블랙박스 AI 아닌 '설명 가능 인공지능'이어야 하는 이유
-> "AI 무기는 안 된다" 外··· 인공지능의 위험성에 대한 경고 11선
-> "나는 우려한다"··· 인공지능에 관한 경고 12선
-> 자율주행 차량이 직면한 윤리적인 딜레마
---------------------------------------------------------------

알고리즘 투명성이 야기할 수 있는 기술적 위험을 완화하려면 기업 데이터 전문가가 아래의 전략을 검토해야 한다.

• 데이터 전문가가 모델 결과물에 대한 접근을 제어하고 접근 권한이 남용되는지 모니터링한다. 이 과정에서 데이터 전문가는 투명한 머신러닝 모델에 관한 적대적 공격을 파악해 전면적 위협을 차단한다.

• 투명한 머신러닝 모델의 학습용 데이터에 통제된 양의 무작위한 잡음을 일부러 추가한다. 이러한 잡음을 섭동이라고 한다. 이는 해커가 사후 설명이나 모델 조작을 통해 원본 데이터 자체를 파악하기 어렵게 만든다.

• 최종 머신러닝 모델과 원본 데이터 사이에 중간 레이어를 삽입한다. 이를테면 개별 원본 데이터로 훈련된 ‘학습자’ 또는 ‘연합’ 모델이라는 중간 레이어를 통해 최종 모델을 학습시킨다. 이는 제 3자가 최종 모델에서 생성된 사후 설명으로부터 전체 학습 데이터를 무단 복구하기 더 어렵게 만든다.

물론 기술적인 위험만 존재하지는 않는다. 기업이 머신러닝 모델을 구축하고 학습시키는 방법을 모두 공개한다면 법적 소송이나 규제에 노출될 수 있다. 머신러닝 투명성을 희생하지 않으면서 이러한 비즈니스 위험을 완화하려면 사후 알고리즘 설명이 자동으로 생성되는 데이터 과학 데브옵스가 필요할 것이다.

아울러 기업은 이러한 설명의 이상징후를 끊임없이 모니터링해야 한다. 예를 들면 기업 또는 머신러닝 모델이 해킹되었다는 증거와 같은 것들이다. 이는 중대한 문제다. 머신러닝 모델을 구축하고 학습시킨 기업이 해당 모델의 투명성을 보증할 수 없다면 AI에 대한 신뢰 자체가 무너질 수 있기 때문이다. ciokr@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기

해킹 기술취약점 AI투명성 블랙박스 AI 딥러닝 머신러닝 알고리즘 지적재산권 인공지능 프라이버시 설명가능한AI

“유료 VPN, 분명한 가치 있다” VPN 선택 가이드

VPN (가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인 정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.

평점 - 댓글 -개

평점