Offcanvas

BI / 빅데이터 | 애널리틱스 / 애플리케이션

'조세회피 의혹' 1150만장 문서 분석에 사용된 기술은?

2016.04.06 Holly Morgan  |  ARN
독일 일간지 '쥬트도이체 차이퉁(Süddeutsche Zeitung)'과 국제탐사보도언론인협회(ICIJ)가 각국 정상과 세계적 갑부 등이 조세 회피처에 페이퍼 컴퍼니를 설립했다는 이른바 '파나마 페이퍼' 자료를 공개해 파문이 커지는 가운데, 이 자료를 분석하는 과정에서 호주의 사이버 보안 업체인 '눅스(Nuix)'가 핵심적인 기술을 제공한 것으로 알려졌다.

유출된 자료의 전체 용량은 2.6TB에 달한다. 문서 1,150만 장 분량이다. 파나마 법률 회사인 '모색 폰세카(Mossack Fonseca)'가 익명의 해외 지사를 설립하도록 지원한 내용이 상세하게 기록돼 있다. ICIJ의 이사 제러드 라일은 "이번 조사에서 눅스 소프트웨어가 큰 역할을 했다"며 "데이터를 처리, 색인, 분석하는 데 이 소프트웨어를 사용했다"고 말했다.

먼저 ICIJ는 눅스의 광학 문자인식 기술을 이용해 수백만 장의 문서를 검색할 수 있도록 스캔했다. 이후 눅스 분석 툴을 통해 문서 전체에서 사람 이름을 추출했고, 이를 모색 폰세카의 고객 이름과 대조했다. 이번에 조사한 데이터 규모는 2013년 ICIJ의 역외 탈세 조사 당시와 비교해 데이터 크기는 10배, 문서량은 5배 정도 많은 것이다.

눅스의 최고 임원 에디 쉬이는 "이 정도의 데이터도 매우 큰 것이기는 하지만 사법당국의 조사와 비교하면 평균 정도이고, 심지어 매일 이 정도 분량의 데이터를 처리하는 고객사도 있다"며 "전 세계에서 눅스만이 이런 규모의 데이터를 빠르고 정확하게 처리할 수 있는 기술을 가졌다"고 말했다. 눅스는 이번 조사를 위해 자사의 소프트웨어를 쥬트도이체 차이퉁와 ICIJ에 무상으로 제공했다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.