Offcanvas

애플리케이션

애널리틱스 세계로의 초대··· MS 엑셀 200% 활용하기

2018.10.30 Andy Patrizio  |  Computerworld
마이크로소프트 엑셀(Microsoft Excel)은 많은 직장인이 많이 사용하는 스프레드시트 애플리케이션이다. 마이크로소프트는 1990년대 말부터 분석 기능을 추가한 이후 매월 오피스 365를 업데이트하면서 분석 기능을 꾸준히 개선하고 있다. 이제 엑셀은 단순히 행과 열을 계산하는 도구에 그치지 않고, 과거보다 더 효과적으로 데이터를 분석할 수 있는 꽤 강력한 도구가 됐다.

그리고 많은 사람이 이 도구를 사용하고 있다. 올해 초, 소스미디어 리서치(SourceMedia Research)가 데이터 툴 업체인 팍사타(Paxata)의 의뢰를 받아 조사한 결과를 보면, 기업 68%가 데이터 준비 툴로 마이크로소프트 엑셀을 사용한다. 이 조사는 연 매출이 1억 달러가 넘는 중견기업 이상에서 근무하는 경영진 및 IT 종사자 290명을 대상으로 했다.

이런 기업에는 빅데이터를 테스트하는 곳만 해당하지 않는다. 조사 결과를 보면, ‘데이터 품질’이 성숙기에 도달한 기업도 엑셀과 맞춤형 코딩, SQL을 꽤 중요하게 사용한다. 다시 말해, 분석 관련 이니셔티브가 발전한 단계에 있는 기업도 주요 작업에 계속해서 엑셀을 사용하고 있다.

엑셀 교육 과정을 제공하는 미스터엑셀(MrExcel)의 빌 제렌은 “엑셀 사용자가 7억 5,000만 명이 넘는다. 정렬과 필터링 방법, 피벗 테이블을 다루는 방법을 알고 있는 사람이 그만큼 많다는 이야기이다. 이 제품의 활용법을 이미 알고 있는 사용자 기반이 엄청나다. 다른 툴을 구매했을 때 모든 사람을 훈련해야 하는, 즉 학습 곡선이 없다는 의미다”라고 말했다.

마이크로소프트의 엑셀 그룹 프로그램 매니저인 브라이언 존스는 “엑셀이 분석이나 비즈니스 프로세스의 출발점이 되는 경우가 대부분이다. 사람들은 엑셀로 시작한다. 그러다 정말로 큰 프로젝트에 직면해 엑셀을 ‘졸업’하고 마이크로소프트 프로젝트(Microsoft Project) 같은 도구를 사용하기 시작한다. 엑셀은 이런 ‘기초’ 비즈니스 프로세스를 모두 처리할 수 있는 기능을 지원한다. 비즈니스 프로세스가 항상 바뀌어도 엑셀 덕분에 여기에 적응할 수 있다”라고 말했다.

덴버에서 활동하고 있는 프리랜서 컨설턴트인 짐 설리반에 따르면, 엑셀은 기본적으로 회계와 부기용 툴로 개발됐지만, 지금은 투자대비효과(ROI) 분석을 할 수 있는 템플릿을 다양하게 지원한다. 그는 “사람들은 다양한 용도에 엑셀을 사용하고 있다. 현장에서 보면 엑셀은 거의 모든 작업에서 최소 용인할 수 있는 수준의 기능과 성능을 제공한다. 예를 들어, 미흡하지만 프레젠테이션 툴이기도 하다. 파워포인트 프레젠테이션에 멋진 그래프를 집어넣을 수 있다”라고 말했다.

엑셀의 강력한 툴들
엑셀의 중심에는 데이터 행을 신속하게 집약된 보고서로 바꿀 수 있는 피벗 테이블(pivot table)이 있다. 불러오기(Vlookups) 기능을 이용해 데이터를 검색하는데, 수천 행 정도 처리하는 것은 아무런 문제가 없다. 물론 처리량이 수십 만 행까지 늘어나면 실행 속도가 느려진다.

피벗 테이블은 엑셀의 기본이다.

마이크로소프트는 더 강력한 분석 기능과 도구를 엑셀에 추가했다. 마이크로소프트의 존스에 따르면, 업체가 지난 5년을 투자한 기능이 하나 있다. 바로 파워 피벗(Power Pivot)이다. 100만 행까지만 지원하는 엑셀의 단점을 보완하는 기능이다. 예를 들어 빅데이터의 경우, 데이터 행이 수천 만, 또는 수억 개에 달한다. 100만 행만 지원하는 것은 매우 큰 제약사항이다.

이때 ‘내부 데이터 모델’로 불리는 파워 피벗을 이용하면, 수천 만 행을 처리할 수 있다. 또 여러 개의 조인(Join)으로 기본 피벗 테이블을 사용할 때보다 더 복잡한 테이블을 처리할 수 있다. 파워 피벗은 기본적으로 엑셀 내부에서 실행되는 SQL 서버 분석 서비스 엔진이다. 존스에 따르면, 여러 SQL 서버와 파워 BI, 마이크로소프트 비즈니스 분석 툴이 이 기술을 공통적으로 사용한다. 따라서 필요한 경우 엑셀로 개발한 파워 피벗을 서버로 마이그레이션할 수 있다.

파워 피벗을 이용하면 여러 테이블을 다양하게 조인할 수 있다.

파워 피벗은 엑셀 2010 때 애드-인(Add-in) 기능으로 도입되었다. 이후 윈도우용 엑셀 2013, 2016, 2019에서 기본 기능으로 제공한다.

파워 피벗에서 조인된 테이블은 보고서를 만들 때 사용할 수 있다.

파워 피벗은 데이터 모델 기능이므로 먼저 데이터를 가져와야 한다. 많은 데이터 앱이 ‘엑셀 내보내기(Export to Excel)’를 지원하지만, 마이크로소프트는 여기에 더해 추가로 가져오기 기능을 구현했다. 액티브 디렉터리(Active Directory), XML, 텍스트, JSON, SQL, HDFS, OData, 쉐어포인트(SharePoint), 익스체인지(Exchange), 세일즈포스(Salesforce), 오라클(Oracle), DB2, PostgreSQL, SAP HANA, 테라데이터(TeraData) 등이다.

이들 데이터를 가져온 후에는 데이터 레이크(Data Lake)의 로우 데이터를 중심으로 클린징(정리)과 변환을 해야 한다. 파워 쿼리(Power Query)라는 애드-인 기능에서 기본 기능이 된 ‘가져오기 및 변환(Get & Transform)’ 기능을 이용하면 된다.

'파워 쿼리'라고도 알려진 ‘가져오기 및 변환' 기능을 이용해 데이터 클린징을 할 수 있다.

제렌은 파워 쿼리가 매우 강력하고 유용한 데이터 클린징 툴라고 평가했다. 소스의 데이터를 클린징하면서 적용한 프로세스를 기억하기 때문이다. 예를 들어, 열 제거, 병합 등을 기억했다가 데이터 소스를 다시 고칠 때 재적용한다. 그는 “이 기능은 단순하게 보일 수도 있지만 그 이면에 이런 강력한 기능을 갖추고 있다”라고 말했다.

파워 뷰(Power View)는 엑셀의 또 다른 애드-인 기능이다. 몇 가지 종류의 차트, 테이블 심지어 지도까지 생성할 수 있는 데이터 시각화(비주얼라이제이션) 도구다. 제렌에 따르면, 엑셀에는 79종의 차트가 기본 내장돼 있고 조만간 파워 BI 차트를 지원할 예정이다. 데이터를 강력한 그래프로 요약, 맞춤화 할 수 있다는 의미이다.

또한 ‘다재다능’한 도구인 데이터 테이블(Data Table)도 있다. 민감도 분석, ‘What-if(만약...라면)’ 분석에 사용하는 도구다. 데이터 테이블을 이용하면 “다음 해 예산이 X에서 Y로 변경될 경우, 줄여야 하는 비용은?” 같은 가설에 대답할 수 있는 예측 모델 등을 만들 수 있다. 또는 이자율 변동이 월 납부액에 어떤 영향을 주는지 알 수 있는 부동산 담보 대출 계산에도 유용하다.

데이터 테이블을 이용하면 '만약 ~라면' 분석을 할 수 있다.

기존 버전 엑셀에서도 역사적 데이터를 조사해 ‘높고 낮은’ 범위로 예측을 할 수 있는 기능이 있었지만, 이는 ‘선형적’인 기능에 가까웠다. 반면 엑셀 2016부터는 마이크로소프트가 산하 연구집단과 개발한 포케스트 시트(Forecast Sheet) 기능이 추가됐다. “무슨 일이 일어났는가?’, ‘왜 일어났는가?’, ‘이로 인해 일어날 일은 무엇인가?’ 같은 질문에 대해 더 정확하게 재무 예측을 할 수 있다. 마이크로소프트는 엑셀이 자동으로 누락 값을 처리해 데이터의 ‘계절성’을 파악하고, 지수 평활법 기법을 사용하는 기능도 추가했다.

또 최근에는 엑셀에서 클라우드 컴퓨팅 플랫폼인 애저(Azure)의 머신러닝 서비스 애저ML(AzureML)를 기본 지원한다. 따로 코드를 작성하지 않고도 엑셀에서 쉽게 애저 웹 서비스를 호출할 수 있도록 지원하기 위해서다. 이를 활용하면, 예를 들어 고객의 긍정적, 부정적 피드백 등을 조사해 영업 실적에 대한 감성 분석을 할 수 있다.

존스는 “데이터 과학자가 이 기능을 이용하면 더 복잡한 모델, 더 복잡한 예측 모델을 만들 수 있다. 머신러닝 모델을 구현할 수도 있고, 이를 사람들이 기능 이름으로 호출할 수 있는 웹 서비스로 실행할 수도 있다”라고 말했다. 데이터 분석이 부상하면서, 비즈니스 사용자가 데이터를 더 정교히 처리해야 할 필요성이 높아졌다. 마이크로소프트는 엑셀에 애저ML을 통합해 일반 비즈니스 사용자도 과거 어느 때보다 쉽게 데이터 과학자가 하는 일과 같은 일을 하고 그 장점을 누릴 수 있도록 지원한다.


엑셀의 단점
엑셀을 분석 도구로 활용할 때 직면하게 되는 단점도 있다. 꽤 명확하게 드러나는 단점이다. 먼저, 엑셀은 클라이언트 도구다. 개별 사용자의 컴퓨터가 그 성능을 결정한다. 회사의 시스템 업그레이드 주기가 길어서 현재 2010년산 인텔 CPU와 4GB 메모리가 장착된 윈도우 7 노트북 컴퓨터를 사용하고 있다면, 400만 행으로 구성된 데이터베이스를 분석할 수 없다. 또한 파워 피벗은 엑셀 64비트 버전에서만 지원하며, 데이터 특징에 따라 압축률이 달라질 수 있다.

또 다른 문제는 컴퓨터를 계속 켜 놓고 사용해야 하는 것이다. 이 때문에 노트북 컴퓨터가 느릴 수 있는데, 그러면 십중팔구 생산성을 해치게 된다. 설리번은 과거 30개 매장을 보유한 소매업체 사례를 소개했다. 그는 "이 회사는 재고 관리에 엑셀을 사용했는데 꽤 정교한 워크북을 만들었다. 각 매장에서 수동으로 집계한 결과를 데이터베이스에 비교하고 차이를 파악하는 것이었다. 그런데 이를 완료하는 데 4~8시간이 걸렸다. SQL 서버에 집어넣을 경우 5분이면 끝나는 작업이다”라고 말했다.

제렌 또한 재고 관련 작업에 엑셀을 사용하지 말라고 충고했다. 새 원료를 구입했다면 원료마다 원가가 다른데, 각 원료의 사용 내역을 개별적으로 추적해야 한다. 특정 원료는 X달러, 또 다른 원료는 Y달러이기 때문이다. 그는 “이런 작업은 엑셀보다는 퀵북(QuickBooks) 같은 회계 소프트웨어가 더 적합하다"라고 말했다.

엑셀의 향후 전망
마이크로소프트는 정기적으로 엑셀 365에 새로운 기능을 추가하고 있다. 이렇게 업데이트한 기능들이 9월 출시된 오피스 2019 패키지의 일부로 포함돼 있다. 존스에 따르면, 마이크로소프트는 데이터에서 인사이트를 뽑아낼 수 있는 새로운 데이터 소스와 도구를 추가하고 있다. 또 이런 기능 가운데 상당수를 인사이트 탭 아래 제공하고 있다.

또 모든 종류의 애드혹(Ad-hoc) 분석에 사용하고, 제품의 접근성을 높이고, 성능과 신뢰도를 높이는 고급 기능들에 머신러닝을 더 많이 추가, 통합하고 있다. 또한 팀워크 기능도 추가했다. 마이크로소프트는 최근 여러 사람이 엑셀 파일을 동시 작업할 수 있는 기능을 추가했다. 또한 그룹이 분석을 할 수 있도록 기능을 확대할 계획이다. 아직 발표되지 않았지만, 곧 정식 출시될 기능이다.

현재 엑셀을 간단한 계산에만 사용하고 있다면, 그 기능의 극히 일부만 사용하는 것이다. 이미 사용하고 있는 툴이므로 여기서 소개한 기능을 사용하면 더 쉽게 분석의 세계에 입문할 수 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.