2016.11.30

이디스커버리와 클라우드의 만남··· 80년 역사 '리코'의 디지털 혁신기

Thor Olavsrud | CIO
리켄 감광지(Riken Sensitized Paper)로 사업을 시작한 일본의 다국적 기업 리코(Ricoh)는 지난 80년 동안 제조업으로 명성을 떨쳤다. 하지만 이 긴 역사도 디지털 혁신이라는 큰 변화를 비껴가지 못했다.


Image Credit: Getty Images Bank

미국 펜실베이니아 몰번에 위치한 리코 USA(Ricoh USA)의 이디스커버리(eDiscovery), 영업, 운영 담당 부사장 데이비드 그리썸는 "많은 이가 리코를 80년 이상 된 제조기업으로 생각하지만 리코는 지난 수년간 제조보다 정보 관리에 집중하고 있다"라고 말했다.

리코는 카메라와 사무용 전자 제품을 주력 사업으로 하고 있다. 피트니-보우스(Pitney-Bowes)와 도시바를 복사기를 납품했고, AT&T와 옴니팩스(Omnifax)에 팩스기, 오리지널 NES(Nintendo Entertainment System)에 8비트 프로세서를 공급했다. 2000년대 초반까지 리코는 세계 최대 복사기 제조업체였다. 이미지 처리와 인쇄 솔루션, 산업 제품, 디지털 카메라에 대한 특허를 4만 6,000개 이상 갖고 있고 직원 수는 전 세계 10만 9,000명에 달한다.

제조에서 디지털 서비스로의 움직임
그러나 리코는 핵심 사업을 제조에서 도큐먼트메일(DocumentMail)과 리코독스(RicohDocs) 같은 SaaS(Software as a Service) 문서 관리 솔루션과 글로벌스캔(GlobalScan) 같은 문서 솔루션 등으로 확장하고 있다. 그리고 지난 15년 동안 리코 USA는 이디스커버리 사업에 집중했다. 이디스커버리 사업은 하드웨어 제조에서 디지털 서비스로의 전환의 가장 선두에 있다.

이디스커버리란 법적 소송 당사자가 상대방이나 제3자로부터 소송과 관련된 모든 전자기록을 수집할 수 있도록 허용하는 것을 의미한다(한국은 아직 도입하지 않았다). 수집 대상에는 이메일, 문서, 프레젠테이션, 데이터베이스, 음성 메일, 오디오와 비디오 파일, 소셜 미디어, 웹 사이트 등이 모두 포함된다. 전자 파일은 출력물보다 훨씬 빈번하게 업데이트되므로 타임스탬프(Timestamp) 등의 메타 데이터도 중요한 자료이다.

종이만 사용하던 시절에는 필요한 정보를 찾기 위해 대규모 변호사팀이 수 주 혹은 수 개월에 걸쳐 문서로 가득 찬 박스를 일일이 뒤져야했다. 이것도 벅찬 일이었지만 디지털 세계가 도래하면서 정보의 양이 기하급수적으로 늘어났다. 그리썸은 "우리는 막대한 데이터를 갖고 있고 이를 소송에 사용한다. 변호사는 점차 많은 데이터를 검토해야 하는 상황이다"라고 말했다. 어떤 경우에는 법원에서 요구하는 시한 이내에 사람이 처리하기에 불가능한 수준의 데이터를 봐야 하는 경우도 있다. 예측 분석과 머신러닝의 필요성이 대두되는 것도 이 때문이다.


예측 분석과 머신러닝의 구조
그리썸은 "머신러닝을 통해 '예측 부호화(Predictive Coding)'라는 기능을 활용할 수 있다. 변호사는 각 문서를 검토할 때 관련성이 없거나 기밀이거나 권한이 있다는 등의 분류를 하는데 이를 부호화라 한다. 예측 부호화를 통해 시드 셋(seed set)을 얻고 1,000개 또는 2,000개 문서를 분류할 수 있다. 기존의 문서 검토 내용은 나머지 문서에도 적용된다. 법원에서 이 기술을 인정함에 따라 민간에서도 서서히 이를 도입하는 추세이다. 데이터가 너무 많아 변호사가 모든 것을 검토할 수 없을 수도 있다고 인정하기 시작한 것이다"라고 말했다.

예측 부호화 기술을 이용하면 작은 규모의 변호사팀도 진행 중인 소송과 관련된 문서를 손쉽게 찾아 확보할 수 있다. 그리썸은 "법률팀이 데이터에 더 신속하게 액세스하고 분석해 문서 더미를 관리 가능한 규모로 줄일 수 있게 되면, 소송에서 이용할 수 있는 '사막 속 바늘'을 더 빠르게 찾을 수 있다"라고 말했다. 따라서 리코의 이디스커버리 사업이 연간 20% 성장했다는 것은 그리 놀랍지 않다.

하지만 리코의 진정한 변화는 여기서부터이다. 업체는 이러한 작업을 자체적으로 구축한 시스템으로 처리하려고 시도하지 않는다. 그리썸은 "우리는 약 2년 전 2014년 8월에 모든 클라이언트 데이터를 클라우드로 옮기기로 결정했다"라고 말했다.

이디스커버리 사업을 퍼블릭 클라우드에서 운영해야 한다는 판단은 급속히 증가하는 데이터양과 더 강력한 보안 필요성 때문이었다. 지리적인 제약과 클라우드보안인증체계(FedRAMP)를 준수하는 가운데 기업의 데이터를 활용할 수 있도록 (미 연방 정부는 세계에서 가장 큰 이디스커버리 서비스 고객이다) 마이크로소프트 애저(Microsoft Azure)를 기반으로 사업을 구축하기로 결정했다.

이때 가장 중요한 기준 중 하나가 암호화였다. 그리썸은 "보안이나 시스템 보호를 위한 모니터링 인력 비용 등을 고려하면 퍼블릭 클라우드 환경을 선택해야 할 이유가 분명했다. 애저는 애플리케이션에 EAR(Encryption At Rest)과 암호화를 지원한다. 사이버 보안과 해커의 행태를 분석한 결과 클라우드에 대한 확신을 가질 수 있었다. 미래 기술을 수용하고 완전한 이체 동형 암호화를 고려했을 때도 결론은 마찬가지였다"라고 말했다.

특히 애저는 데이터를 저장할 지역을 선택할 수 있다. 특정 관할권 또는 국가에 데이터를 보관하는 것에 대한 엄격한 법적 제한이 있는 기업에는 매우 중요한 문제였다. 리코는 2015년 7월 애저로의 마이그레이션을 모두 완료했다.

쥐와 애저
그리썸은 "사실 예상했던 것보다 더 빨랐다. 우리 업계에서는 리코가 최초였다. 일찍 일어나는 새가 벌레를 잡지만 두 번째 쥐가 치즈를 얻는다는 말이 있지 않나? 그래서 우리는 시험 환경을 구축하고 샘플 업로드를 실시했으며 고객을 참여시켰다. 이렇게 점진적으로 진행했는데도 계획보다 두 달 일찍 마이그레이션을 끝냈다"라고 말했다.

현재 리코는 수 분 안에 수 테라바이트의 저장 공간을 제공한다. 과거에는 수주가 걸렸던 작업이다. 또한 고객에 애저의 암호화 프로비저닝과 보안 전문가를 통해 데이터 보안을 제공한다. 이와 동시에 하드웨어 비용을 30% 이상 줄이고 성능을 높였다.

그는 "분명 시행착오는 거쳐야했다. 그러나 이 환경에 대한 마이크로소프트의 경험이 큰 도움이 됐다. 우리의 성과 지표를 보면 애저 환경에서 22%나 증가했다. 우리에게도 그렇고 고객에게도 좋은 것이다. 다운타임(Downtime)과 고객 불만이 없었을 뿐 아니라 성능 개선을 칭찬하는 고객도 많았다"라고 말했다. ciokr@idg.co.kr
2016.11.30

이디스커버리와 클라우드의 만남··· 80년 역사 '리코'의 디지털 혁신기

Thor Olavsrud | CIO
리켄 감광지(Riken Sensitized Paper)로 사업을 시작한 일본의 다국적 기업 리코(Ricoh)는 지난 80년 동안 제조업으로 명성을 떨쳤다. 하지만 이 긴 역사도 디지털 혁신이라는 큰 변화를 비껴가지 못했다.


Image Credit: Getty Images Bank

미국 펜실베이니아 몰번에 위치한 리코 USA(Ricoh USA)의 이디스커버리(eDiscovery), 영업, 운영 담당 부사장 데이비드 그리썸는 "많은 이가 리코를 80년 이상 된 제조기업으로 생각하지만 리코는 지난 수년간 제조보다 정보 관리에 집중하고 있다"라고 말했다.

리코는 카메라와 사무용 전자 제품을 주력 사업으로 하고 있다. 피트니-보우스(Pitney-Bowes)와 도시바를 복사기를 납품했고, AT&T와 옴니팩스(Omnifax)에 팩스기, 오리지널 NES(Nintendo Entertainment System)에 8비트 프로세서를 공급했다. 2000년대 초반까지 리코는 세계 최대 복사기 제조업체였다. 이미지 처리와 인쇄 솔루션, 산업 제품, 디지털 카메라에 대한 특허를 4만 6,000개 이상 갖고 있고 직원 수는 전 세계 10만 9,000명에 달한다.

제조에서 디지털 서비스로의 움직임
그러나 리코는 핵심 사업을 제조에서 도큐먼트메일(DocumentMail)과 리코독스(RicohDocs) 같은 SaaS(Software as a Service) 문서 관리 솔루션과 글로벌스캔(GlobalScan) 같은 문서 솔루션 등으로 확장하고 있다. 그리고 지난 15년 동안 리코 USA는 이디스커버리 사업에 집중했다. 이디스커버리 사업은 하드웨어 제조에서 디지털 서비스로의 전환의 가장 선두에 있다.

이디스커버리란 법적 소송 당사자가 상대방이나 제3자로부터 소송과 관련된 모든 전자기록을 수집할 수 있도록 허용하는 것을 의미한다(한국은 아직 도입하지 않았다). 수집 대상에는 이메일, 문서, 프레젠테이션, 데이터베이스, 음성 메일, 오디오와 비디오 파일, 소셜 미디어, 웹 사이트 등이 모두 포함된다. 전자 파일은 출력물보다 훨씬 빈번하게 업데이트되므로 타임스탬프(Timestamp) 등의 메타 데이터도 중요한 자료이다.

종이만 사용하던 시절에는 필요한 정보를 찾기 위해 대규모 변호사팀이 수 주 혹은 수 개월에 걸쳐 문서로 가득 찬 박스를 일일이 뒤져야했다. 이것도 벅찬 일이었지만 디지털 세계가 도래하면서 정보의 양이 기하급수적으로 늘어났다. 그리썸은 "우리는 막대한 데이터를 갖고 있고 이를 소송에 사용한다. 변호사는 점차 많은 데이터를 검토해야 하는 상황이다"라고 말했다. 어떤 경우에는 법원에서 요구하는 시한 이내에 사람이 처리하기에 불가능한 수준의 데이터를 봐야 하는 경우도 있다. 예측 분석과 머신러닝의 필요성이 대두되는 것도 이 때문이다.


예측 분석과 머신러닝의 구조
그리썸은 "머신러닝을 통해 '예측 부호화(Predictive Coding)'라는 기능을 활용할 수 있다. 변호사는 각 문서를 검토할 때 관련성이 없거나 기밀이거나 권한이 있다는 등의 분류를 하는데 이를 부호화라 한다. 예측 부호화를 통해 시드 셋(seed set)을 얻고 1,000개 또는 2,000개 문서를 분류할 수 있다. 기존의 문서 검토 내용은 나머지 문서에도 적용된다. 법원에서 이 기술을 인정함에 따라 민간에서도 서서히 이를 도입하는 추세이다. 데이터가 너무 많아 변호사가 모든 것을 검토할 수 없을 수도 있다고 인정하기 시작한 것이다"라고 말했다.

예측 부호화 기술을 이용하면 작은 규모의 변호사팀도 진행 중인 소송과 관련된 문서를 손쉽게 찾아 확보할 수 있다. 그리썸은 "법률팀이 데이터에 더 신속하게 액세스하고 분석해 문서 더미를 관리 가능한 규모로 줄일 수 있게 되면, 소송에서 이용할 수 있는 '사막 속 바늘'을 더 빠르게 찾을 수 있다"라고 말했다. 따라서 리코의 이디스커버리 사업이 연간 20% 성장했다는 것은 그리 놀랍지 않다.

하지만 리코의 진정한 변화는 여기서부터이다. 업체는 이러한 작업을 자체적으로 구축한 시스템으로 처리하려고 시도하지 않는다. 그리썸은 "우리는 약 2년 전 2014년 8월에 모든 클라이언트 데이터를 클라우드로 옮기기로 결정했다"라고 말했다.

이디스커버리 사업을 퍼블릭 클라우드에서 운영해야 한다는 판단은 급속히 증가하는 데이터양과 더 강력한 보안 필요성 때문이었다. 지리적인 제약과 클라우드보안인증체계(FedRAMP)를 준수하는 가운데 기업의 데이터를 활용할 수 있도록 (미 연방 정부는 세계에서 가장 큰 이디스커버리 서비스 고객이다) 마이크로소프트 애저(Microsoft Azure)를 기반으로 사업을 구축하기로 결정했다.

이때 가장 중요한 기준 중 하나가 암호화였다. 그리썸은 "보안이나 시스템 보호를 위한 모니터링 인력 비용 등을 고려하면 퍼블릭 클라우드 환경을 선택해야 할 이유가 분명했다. 애저는 애플리케이션에 EAR(Encryption At Rest)과 암호화를 지원한다. 사이버 보안과 해커의 행태를 분석한 결과 클라우드에 대한 확신을 가질 수 있었다. 미래 기술을 수용하고 완전한 이체 동형 암호화를 고려했을 때도 결론은 마찬가지였다"라고 말했다.

특히 애저는 데이터를 저장할 지역을 선택할 수 있다. 특정 관할권 또는 국가에 데이터를 보관하는 것에 대한 엄격한 법적 제한이 있는 기업에는 매우 중요한 문제였다. 리코는 2015년 7월 애저로의 마이그레이션을 모두 완료했다.

쥐와 애저
그리썸은 "사실 예상했던 것보다 더 빨랐다. 우리 업계에서는 리코가 최초였다. 일찍 일어나는 새가 벌레를 잡지만 두 번째 쥐가 치즈를 얻는다는 말이 있지 않나? 그래서 우리는 시험 환경을 구축하고 샘플 업로드를 실시했으며 고객을 참여시켰다. 이렇게 점진적으로 진행했는데도 계획보다 두 달 일찍 마이그레이션을 끝냈다"라고 말했다.

현재 리코는 수 분 안에 수 테라바이트의 저장 공간을 제공한다. 과거에는 수주가 걸렸던 작업이다. 또한 고객에 애저의 암호화 프로비저닝과 보안 전문가를 통해 데이터 보안을 제공한다. 이와 동시에 하드웨어 비용을 30% 이상 줄이고 성능을 높였다.

그는 "분명 시행착오는 거쳐야했다. 그러나 이 환경에 대한 마이크로소프트의 경험이 큰 도움이 됐다. 우리의 성과 지표를 보면 애저 환경에서 22%나 증가했다. 우리에게도 그렇고 고객에게도 좋은 것이다. 다운타임(Downtime)과 고객 불만이 없었을 뿐 아니라 성능 개선을 칭찬하는 고객도 많았다"라고 말했다. ciokr@idg.co.kr
X