2019.04.22

개발자를 위한 '더 스마트한' 데이터 시각화 5단계

Isaac Sacolick | InfoWorld
오늘날 많은 기업이 의사결정의 필수 요소로 모델과 애널리틱스, 데이터 시각화, 대시보드를 활용하며 데이터 중심 기업으로 진화하고 있다. 이러한 일은 비즈니스 리더가 고객 경험을 개선하고자 할 때, 기술 리더가 애자일과 데브옵스, 웹 사이트 매트릭스를 분석하는 경우, 애플리케이션팀이 애플리케이션에 애널리틱스를 추가하고자 할 때 등 다양한 목적으로 진행된다.
 
ⓒ Getty Images Bank

이것이 의미하는 바는 명확하다. 더 많은 개발자와 분석가, 엔지니어, 관리자가 데이터 시각화와 대시 보드 개발에 관여하게 될 것이란 점이다. 태블로나 마이크로소프트 파워 BI 같은 셀프서비스 BI 툴을 도입하는 기업이 늘어나면서 이제 기업 IT팀은 대시 보드를 개발하거나 시급한 개발을 요청 받을 수도 있다. 

이러한 툴은 배우기가 비교적 쉽지만 복잡한 데이터 시각화까지 지원하지는 못한다. 따라서 실무자에겐 별도의 디자인, 개발 전략이 필요하고 기업은 명확한 데이터 시각화 표준을 정해야 한다. 많은 전문가가 이러한 전략을 마련하기 위한 실행 계획부터 태블로와 파워 BI용 플랫폼별 표준까지 다양한 조언을 내놓았다. 여기서는 특히 개발자가 고려해야 하는 5가지를 모았다.

1. 데이터 준비를 위한 디스커버리 대시보드를 사용하라
개발자와 비즈니스 애널리스트, 데이터 과학자는 종종 데이터 작업 과정에서 사용자가 기본적인 인사이트를 검토, 발견할 수 있는 차트와 대시보드를 개발한다. 이러한 대시보드는 데이터나 데이터의 품질 혹은 어떤 인사이트가 유용할 지 잘 모를 때 개발 프로세스의 일부로 필요하다. 이 과정에서 몇 가지 질문을 던져보는 것이 중요하다. 

- 데이터가 충분히 유용한가? 더욱 완전한 내용을 얻기 위해 다른 데이터 소스와 결합해야 하는가?  
- 데이터가 상대적으로 잘 처리돼 있는가? 의사 결정에 이용하기 전에 데이터 전처리와 클린징이 필요한가?
- 차원, 비닝 치수, 컴퓨팅 집계 및 기타 분석의 단순화를 위해 필요한 애널리틱스를 그룹화하는가? 


이러한 질문은 초기에 유용하며, 데이터를 추가로 조작해야 할 때마다 필요에 따라 반복한다.

2. 미리 질문에 답해보라
데이터 시각화에 대한 준비가 끝나면 다음을 고려하자.

- 시각화는 어떤 문제를 다루는가?
- 누가 사용할 것인가?
- 시각화에서 파생된 인사이트로 무엇을 하려 하나?


첫 번째 질문은 시각화의 제목을 정하는 데 도움이 된다. 많은 사람이 이 중요한 단계를 잊어버리기 때문에 사용자가 시각화를 왜 그리고 어떻게 이용해야 하는지 알지 못하는 경우가 많다. 두 번째 질문은 상세 내용과 정교화의 수준을 정하는 데 도움이 된다. 어떤 경영자는 실적 지표와 추세를 원하는 반면에 어떤 관리자는 애널리틱스의 이면을 파고들어 이해하고자 한다. 

세 번째 질문은 어떤 유형의 정보가 필요한 지 그리고 다른 시스템과의 통합이 유용한지 확인하는 데 필요하다. 예를 들어, 대시보드가 지라(Jira)의 애자일 매트릭스를 분석하는 경우 사용자가 지라의 릴리스, 에픽 및 스토리를 클릭하도록 허용하는 것이 유용할 수 있다. 최종 사용자가 누구인지 아는 것은 통합 시스템으로 어떤 유형의 활동을 그들이 수행해야 하는가를 결정하는 데 도움이 될 수 있다. 

3. 일관된 레이아웃과 차트 유형 및 스타일을 만들어라
기왕이면 최종 사용자가 질문에 답을 하면서 애널리틱스를 검토하기 원할 수도 있는 차원, 계층 구조 및 필터 등 모두를 완전히 반영하고 있는 대시보드 레이아웃을 만들고 싶을 수 있다. 하지만 너무 많은 대시보드를 넘나들어야 한다면 최종 사용자는 서로 다른 디자인을 오고 가며 학습하고 작업해야 하는 데서 오는 복잡성 때문에 질려버릴 것이다. 이는 화면마다 각기 다른 탐색바를 가진 웹사이트를 디자인하는 것과 같기 때문이다.

따라서 일관된 레이아웃, 차트 유형 및 스타일을 고안해 내야 한다. 새로운 대시보드를 찾아오는 사용자는 그들이 이미 사용하고 있는 다른 대시보드와 공통점이 있는 편안함을 느껴야 한다. 검색 인터페이스와 필터는 일관된 위치에 있어야 한다. 기본적인 차원은 다른 대시보드에 표시될 때도 일관된 차트 유형을 사용해야 한다. 차원과 치수도 일관된 색상, 글꼴 및 포맷을 사용해야 한다. 
4. 시각적 요소를 가진 스토리텔링을 가지도록 하라
질문을 정하고 레이아웃 표준에 따라 대시보드 구조를 디자인했다면 다음 단계는 그 시각화가 유용하고 인사이트를 줄 수 있는 지 확인하는 것이다. 최종 사용자가 감탄할 거라고 기대하지 말자. 가장 좋은 대시보드는 그들의 관심을 끌기 위해 명시적이면서도 암묵적인 단서를 사용하는 것이다. 데이터와 시각적 디자인이 있는 스토리텔링에 관한 서적과 논문이 많지만, 여기서는 기초적인 것을 몇 가지 살펴보자.

- 데이터에 주입하는 차원에 있어서는 시각자료를 더 많이 사용하고 필터는 더 적게 사용하라.
- 라벨링, 위치지정, 스타일링 축, 눈금, 색상 범례 및 데이터 포인트로 실행된 기본적인 차트 작성 표준을 마련하라.
- 아웃라이어가 중요할 수 있다. 아웃라이어를 필터링 하지 말고 중요할 것 같은 것은 강조표시를 해둔다. 
- 사용자는 일반적으로 기본 차트 유형을 이해하지만 분산형 플롯, 상자 및 수염 그림, 레이더 차트, 다중 레벨 파이 차트 및 그 밖의 더 복잡한 차트 유형에는 익숙하지 않을 수 있다. 따라서 가치를 더하고 인사이트를 강조할 때만 복잡한 시각 자료를 사용하자. 또한 최종 사용자가 숨막혀 하지 않도록 이들 대시보드에 그 밖의 요소는 사용을 줄여야 한다.
- 많은 BI 도구가 데이터에 주석을 달거나 연속적인 대시보드 상호 작용을 스토리로 캡처하는 기능을 지원한다. 이러한 도구를 활용하는 법을 배우자. 기업 환경에서는 분명하고 직접적인 것이 인사이트를 이해하는 가장 실질적인 접근법임을 기억하자. 
- 스토리텔링은 맥락이 필요하다. 이를 위한 데이터 시각화는 추세, 기준선, 비교, 벤치 마크, 시나리오, 예측 그리고 분석 또는 의사 결정을 위한 배경을 제공하는 기타 요소를 사용할 수 있다.
- 경험을 개인 맞춤화하라. 예컨대, 최종 사용자가 유럽 실적 수치에만 관심이 있는 경우 이런 선호에 따라 대시보드가 열리도록 하는 것이 좋다.


이밖에 더 관심이 있다면 도서인 ‘데이터로 하는 스토리 텔링(Storytelling with Data)’을 추천한다. 태블로 퍼블릭(Tableau Public)이 제공하는 ‘최고의 시각자료들’을 참고하거나 ‘2018년 최고 데이터 시각화’를 살피는 것도 방법이다. 전문가시각화 블로그를 팔로우하는 것도 좋다.

5. 데이터와 디자인을 반복하라 
일단 대시보드를 사용하기 시작하면 지속적으로 개선할 필요가 있다. 새로운 대시보드는 특히 새로운 데이터 세트에서 개발할 때 종종 내재적인 데이터 품질 문제를 노출하곤 한다. 따라서 대시보드의 첫 번째 버전은 현명한 의사 결정을 방해할 수 있는 주요 데이터 품질 문제를 처리해야 한다. 

데이터 시각화는 소프트웨어 애플리케이션과 같다. 사용성을 끊임없이 개선해야 한다. 대시보드 개발자는 최종 사용자의 손에 실행 가능한 제품을 쥐여주고 사용하는 방식을 관찰하고 개선이 필요한 피드백을 수집해야 한다.

끝으로, 대시 보드는 의사 결정 및 데이터의 현재 상태도 반영해야 한다. 인사이트는 시간이 지남에 따라 덜 중요해지기 마련이다. 애널리틱스 및 데이터 시각화를 해야 하는 새로운 비즈니스 목표와 이해 관계자의 상황 변화를 고려해야 한다. 이 때문에 어떤 경우에는 새로운 대시 보드를 만들어야 하지만, 다른 때는 기존 것을 개선하는 것이 더 효율적이기도 하다.

데이터 시각화는 대시보드 개발과 배치의 일환으로 버전 관리, 테스트 및 릴리스 관리를 표준화해 이러한 변화를 지원한다. 이제 점점 더 많은 사람이 대시보드를 개발하거나 BI 프로그램에 참여하고 있으므로, 기업은 이와 관련된 개발과 디자인 표준을 시급하게 수립하고 개선해야 한다. ciokr@idg.co.kr



2019.04.22

개발자를 위한 '더 스마트한' 데이터 시각화 5단계

Isaac Sacolick | InfoWorld
오늘날 많은 기업이 의사결정의 필수 요소로 모델과 애널리틱스, 데이터 시각화, 대시보드를 활용하며 데이터 중심 기업으로 진화하고 있다. 이러한 일은 비즈니스 리더가 고객 경험을 개선하고자 할 때, 기술 리더가 애자일과 데브옵스, 웹 사이트 매트릭스를 분석하는 경우, 애플리케이션팀이 애플리케이션에 애널리틱스를 추가하고자 할 때 등 다양한 목적으로 진행된다.
 
ⓒ Getty Images Bank

이것이 의미하는 바는 명확하다. 더 많은 개발자와 분석가, 엔지니어, 관리자가 데이터 시각화와 대시 보드 개발에 관여하게 될 것이란 점이다. 태블로나 마이크로소프트 파워 BI 같은 셀프서비스 BI 툴을 도입하는 기업이 늘어나면서 이제 기업 IT팀은 대시 보드를 개발하거나 시급한 개발을 요청 받을 수도 있다. 

이러한 툴은 배우기가 비교적 쉽지만 복잡한 데이터 시각화까지 지원하지는 못한다. 따라서 실무자에겐 별도의 디자인, 개발 전략이 필요하고 기업은 명확한 데이터 시각화 표준을 정해야 한다. 많은 전문가가 이러한 전략을 마련하기 위한 실행 계획부터 태블로와 파워 BI용 플랫폼별 표준까지 다양한 조언을 내놓았다. 여기서는 특히 개발자가 고려해야 하는 5가지를 모았다.

1. 데이터 준비를 위한 디스커버리 대시보드를 사용하라
개발자와 비즈니스 애널리스트, 데이터 과학자는 종종 데이터 작업 과정에서 사용자가 기본적인 인사이트를 검토, 발견할 수 있는 차트와 대시보드를 개발한다. 이러한 대시보드는 데이터나 데이터의 품질 혹은 어떤 인사이트가 유용할 지 잘 모를 때 개발 프로세스의 일부로 필요하다. 이 과정에서 몇 가지 질문을 던져보는 것이 중요하다. 

- 데이터가 충분히 유용한가? 더욱 완전한 내용을 얻기 위해 다른 데이터 소스와 결합해야 하는가?  
- 데이터가 상대적으로 잘 처리돼 있는가? 의사 결정에 이용하기 전에 데이터 전처리와 클린징이 필요한가?
- 차원, 비닝 치수, 컴퓨팅 집계 및 기타 분석의 단순화를 위해 필요한 애널리틱스를 그룹화하는가? 


이러한 질문은 초기에 유용하며, 데이터를 추가로 조작해야 할 때마다 필요에 따라 반복한다.

2. 미리 질문에 답해보라
데이터 시각화에 대한 준비가 끝나면 다음을 고려하자.

- 시각화는 어떤 문제를 다루는가?
- 누가 사용할 것인가?
- 시각화에서 파생된 인사이트로 무엇을 하려 하나?


첫 번째 질문은 시각화의 제목을 정하는 데 도움이 된다. 많은 사람이 이 중요한 단계를 잊어버리기 때문에 사용자가 시각화를 왜 그리고 어떻게 이용해야 하는지 알지 못하는 경우가 많다. 두 번째 질문은 상세 내용과 정교화의 수준을 정하는 데 도움이 된다. 어떤 경영자는 실적 지표와 추세를 원하는 반면에 어떤 관리자는 애널리틱스의 이면을 파고들어 이해하고자 한다. 

세 번째 질문은 어떤 유형의 정보가 필요한 지 그리고 다른 시스템과의 통합이 유용한지 확인하는 데 필요하다. 예를 들어, 대시보드가 지라(Jira)의 애자일 매트릭스를 분석하는 경우 사용자가 지라의 릴리스, 에픽 및 스토리를 클릭하도록 허용하는 것이 유용할 수 있다. 최종 사용자가 누구인지 아는 것은 통합 시스템으로 어떤 유형의 활동을 그들이 수행해야 하는가를 결정하는 데 도움이 될 수 있다. 

3. 일관된 레이아웃과 차트 유형 및 스타일을 만들어라
기왕이면 최종 사용자가 질문에 답을 하면서 애널리틱스를 검토하기 원할 수도 있는 차원, 계층 구조 및 필터 등 모두를 완전히 반영하고 있는 대시보드 레이아웃을 만들고 싶을 수 있다. 하지만 너무 많은 대시보드를 넘나들어야 한다면 최종 사용자는 서로 다른 디자인을 오고 가며 학습하고 작업해야 하는 데서 오는 복잡성 때문에 질려버릴 것이다. 이는 화면마다 각기 다른 탐색바를 가진 웹사이트를 디자인하는 것과 같기 때문이다.

따라서 일관된 레이아웃, 차트 유형 및 스타일을 고안해 내야 한다. 새로운 대시보드를 찾아오는 사용자는 그들이 이미 사용하고 있는 다른 대시보드와 공통점이 있는 편안함을 느껴야 한다. 검색 인터페이스와 필터는 일관된 위치에 있어야 한다. 기본적인 차원은 다른 대시보드에 표시될 때도 일관된 차트 유형을 사용해야 한다. 차원과 치수도 일관된 색상, 글꼴 및 포맷을 사용해야 한다. 
4. 시각적 요소를 가진 스토리텔링을 가지도록 하라
질문을 정하고 레이아웃 표준에 따라 대시보드 구조를 디자인했다면 다음 단계는 그 시각화가 유용하고 인사이트를 줄 수 있는 지 확인하는 것이다. 최종 사용자가 감탄할 거라고 기대하지 말자. 가장 좋은 대시보드는 그들의 관심을 끌기 위해 명시적이면서도 암묵적인 단서를 사용하는 것이다. 데이터와 시각적 디자인이 있는 스토리텔링에 관한 서적과 논문이 많지만, 여기서는 기초적인 것을 몇 가지 살펴보자.

- 데이터에 주입하는 차원에 있어서는 시각자료를 더 많이 사용하고 필터는 더 적게 사용하라.
- 라벨링, 위치지정, 스타일링 축, 눈금, 색상 범례 및 데이터 포인트로 실행된 기본적인 차트 작성 표준을 마련하라.
- 아웃라이어가 중요할 수 있다. 아웃라이어를 필터링 하지 말고 중요할 것 같은 것은 강조표시를 해둔다. 
- 사용자는 일반적으로 기본 차트 유형을 이해하지만 분산형 플롯, 상자 및 수염 그림, 레이더 차트, 다중 레벨 파이 차트 및 그 밖의 더 복잡한 차트 유형에는 익숙하지 않을 수 있다. 따라서 가치를 더하고 인사이트를 강조할 때만 복잡한 시각 자료를 사용하자. 또한 최종 사용자가 숨막혀 하지 않도록 이들 대시보드에 그 밖의 요소는 사용을 줄여야 한다.
- 많은 BI 도구가 데이터에 주석을 달거나 연속적인 대시보드 상호 작용을 스토리로 캡처하는 기능을 지원한다. 이러한 도구를 활용하는 법을 배우자. 기업 환경에서는 분명하고 직접적인 것이 인사이트를 이해하는 가장 실질적인 접근법임을 기억하자. 
- 스토리텔링은 맥락이 필요하다. 이를 위한 데이터 시각화는 추세, 기준선, 비교, 벤치 마크, 시나리오, 예측 그리고 분석 또는 의사 결정을 위한 배경을 제공하는 기타 요소를 사용할 수 있다.
- 경험을 개인 맞춤화하라. 예컨대, 최종 사용자가 유럽 실적 수치에만 관심이 있는 경우 이런 선호에 따라 대시보드가 열리도록 하는 것이 좋다.


이밖에 더 관심이 있다면 도서인 ‘데이터로 하는 스토리 텔링(Storytelling with Data)’을 추천한다. 태블로 퍼블릭(Tableau Public)이 제공하는 ‘최고의 시각자료들’을 참고하거나 ‘2018년 최고 데이터 시각화’를 살피는 것도 방법이다. 전문가시각화 블로그를 팔로우하는 것도 좋다.

5. 데이터와 디자인을 반복하라 
일단 대시보드를 사용하기 시작하면 지속적으로 개선할 필요가 있다. 새로운 대시보드는 특히 새로운 데이터 세트에서 개발할 때 종종 내재적인 데이터 품질 문제를 노출하곤 한다. 따라서 대시보드의 첫 번째 버전은 현명한 의사 결정을 방해할 수 있는 주요 데이터 품질 문제를 처리해야 한다. 

데이터 시각화는 소프트웨어 애플리케이션과 같다. 사용성을 끊임없이 개선해야 한다. 대시보드 개발자는 최종 사용자의 손에 실행 가능한 제품을 쥐여주고 사용하는 방식을 관찰하고 개선이 필요한 피드백을 수집해야 한다.

끝으로, 대시 보드는 의사 결정 및 데이터의 현재 상태도 반영해야 한다. 인사이트는 시간이 지남에 따라 덜 중요해지기 마련이다. 애널리틱스 및 데이터 시각화를 해야 하는 새로운 비즈니스 목표와 이해 관계자의 상황 변화를 고려해야 한다. 이 때문에 어떤 경우에는 새로운 대시 보드를 만들어야 하지만, 다른 때는 기존 것을 개선하는 것이 더 효율적이기도 하다.

데이터 시각화는 대시보드 개발과 배치의 일환으로 버전 관리, 테스트 및 릴리스 관리를 표준화해 이러한 변화를 지원한다. 이제 점점 더 많은 사람이 대시보드를 개발하거나 BI 프로그램에 참여하고 있으므로, 기업은 이와 관련된 개발과 디자인 표준을 시급하게 수립하고 개선해야 한다. ciokr@idg.co.kr

X