2021.07.23

‘소수의 영웅적 활동 넘어서게’··· 렉스마크의 데이터 혁신 여정

Thor Olavsrud | CIO
매주 생성되는 테라바이트 단위의 데이터에서 비즈니스 가치를 뽑아내기 위해, 그리고 데이터 사일로를 제거하기 위해 렉스마크는 단일 엔드투엔드 데이터 소스 아키텍처를 구축했다. 
 
ⓒChris Lawton / Gerd Altmann (CC0)

글로벌 프린터 및 이미징 제품 제조회사 렉스마크 인터내셔널(Lexmark International)에서는 데이터가 매일 쏟아진다. 렉스마크 관리 인쇄 서비스만 해도 약 100만 대의 프린터와 복합기가 등록돼 있어 매주 테라바이트 이상의 데이터를 생성하고 있다. 현장에 보급된 600만 대 이상의 프린터 역시 고객이 동의한 경우 데이터가 렉스마크와 공유된다. 

그 데이터를 관리하고 그 데이터에서 인사이트를 얻는 일은 벅찬 일이었다. 이를 위해 회사는 ‘렉스마크 PDT(Product Digital Thread)’를 만들었다. PDT는 제품의 설계에서부터 재활용에 이르는 전체 생애주기에서 걸쳐 생성되는 실시간 데이터에 대한 실시간 통합 저장소 겸 감사 추적 시스템이다.

렉스마크 트랜스포메이션 제품 책임자 앤디 코프는 “(PDT 덕분에) 핵심 인쇄 부품은 물론 여타 하드웨어와 소모품 등이 생애주기에 걸쳐 활용되는 상호 연관 데이터가 생성되고 있다”라고 설명했다. 

그는 이어 “이것이 제대로 드러나는 곳은 애저(Azure) 데이터 레이크 내의 소위 원시, 정제, 소비 등의 계층이다. 이 3개의 데이터 계층은 비즈니스 사용자 종류의 전 범위에 걸쳐 사용자들을 지원하고 우리가 해야 하는 애널리틱스를 지원한다”라고 덧붙였다.


렉스마크의 데이터 과제
렉스마크의 힘든 점은 데이터 용량만이 아니었다. 렉스마크의 데이터가 CADD, PLM, ERP, CRM 등 글로벌 제조회사들의 대표적인 비즈니스 애플리케이션들에 걸쳐 퍼져 있는 것도 문제였다. 게다가 렉스마크의 공급망은 고도로 분산되어 있어서 제품의 설계, 제작, 입고, 유통을 위해 협력을 준비하려면 여러 벽을 넘어 데이터를 전달해야 한다.

코프는 “대규모 글로벌 제조업체가 다 그렇듯이 렉스마크의 비즈니스는 매우 데이터 집약적이다. 특히 이러한 특성이 코로나 사태로 확실히 더욱 커졌다”고 말했다. 

그는 이어 “당사의 가치 사슬은 공급업체의 공급업체에서부터 고객의 고객에 이르기까지 크게 확장되어 있다. 이처럼 확장된 가치 사슬을 통해 제품을 설계, 제조, 실현하는 방식을 비즈니스를 펼치고 있다. 사실 당사는 크게 보면 데이터 회사다”라고 말했다.

이러한 문제들 때문에 렉스마크는 수많은 일괄 처리 및 트랜잭션 통합 수단을 개발하여 소스 기기에서 저장소로의 데이터 이동, 회사와 협력업체 및 고객 간의 데이터 이동, 비즈니스 애플리케이션과의 통합, 그리고 입력, 기록, 소비 시스템에 걸친 마스터 데이터의 동기화를 다각적으로 시도했었다. 

그 결과, 많은 비즈니스 사용자들이 스스로 데이터 활용안을 개척해야 했다. 그리고 이렇게 커스터마이징된 추출물과 저장소에서 만들어진 데이터는 불가피하게 비즈니스 기능과 애플리케이션 내에 고립되곤 했다.

코프는 이로 인해 생애주기에 걸친 데이터 분석이 어려워졌다고 말했다. 생애주기에 걸친 데이터 분석은 보통 일회성으로 교차 기능 팀에서 실시했는데 분석 시간이 며칠 내지 심하면 몇 주나 걸렸다. 

고도로 전문화된 분석 방법을 강구할 수 있는 고급 비즈니스 사용자 데이터 랭글러들이 필요했지만 그렇다면 데이터 파악, 추출, 변환 및 분석 방법에 대한 지식이 그러한 고급 비즈니스 사용자 안에 고립된다는 뜻도 되었다. 즉 일부 전문가, 또는 영웅적 의지를 가진 소수만이 데이터를 제대로 활용하곤 했다. 

데이터 영웅 활동의 필요성 줄이기
코프와 그의 팀은 PDT를 활용해서 데이터 영웅 활동 수행의 필요성을 줄이고 비즈니스 사용자가 광범위하게 접근하여 소비할 수 있는 단일 종단간 데이터 진실 소스를 구축하고자 했다
.
문제 해결에는 기술뿐만 아니라 조직 개편과 재교육도 필요했다. 렉스마크는 최고 정보 및 기술 책임자(지금은 은퇴한 톰 이드) 산하에 IT 그룹과 소프트웨어 R&D 그룹을 합병한 뒤 그룹 내부에 정식 데이터 과학 및 애널리틱스(DS&A) 팀을 확장 CoP(Community of Practice)의 핵심으로 설립했다. DS&A 팀은 렉스마크의 데이터 영웅을 파악하여 발전시키는 일과 마이크로소프트 엑셀 및 VBA 툴을 R, 파이썬과 같은 툴로 대체시키는 일에 전념했다.

코프는 “당사의 데이터 관리 기술 또는 기능 측면은 모두 이 이니셔티브와 관련성을 가졌다”면서 “즉 당사의 전문 기술이 거의 전면적으로 재정비된 것”이라고 말했다.

렉스마크는 직원들의 전환을 돕기 위한 교육 제공에 힘썼다. 단 직원들은 많은 부분을 근무 중에 배워야 했다. 코프는 “근무 중 학습량이 엄청나게 많았다. 따라서 ‘빠른 실패와 실수를 통해 배우고 넘어가라’는 격언을 몸소 실천해야 했다”고 말했다.

이와 동시에 렉스마크는 내부 데이터 거버넌스 기능도 재점검했고 전사적 데이터 거버넌스 및 윤리(EDGE) 커뮤니티를 만들었다. 교차 기능 집행 팀이 EDGE 협의회를 구성하고 있다. EDGE 협의회는 데이터 관리 정책의 최종 검토와 승인을 담당한다. 또한, PDT의 지속적인 개선과 소비자 디지털 쓰레드와 같은 새로운 디지털 쓰레드 구축을 비롯한 렉스마크의 데이터 중심 프로젝트들을 대상으로 우선순위를 설정한다. 

EDGE 협의회는 비즈니스 기능 내에 데이터 집사 및 데이터 관리인을 파악하여 지정하는 일을 비롯한 데이터 역할 및 책임을 규정하는 작업도 감독한다.

PDT의 기능
PDT는 개인정보보호와 보안을 위한 설계, 운영을 위한 설계, 비즈니스 사용자 데이터 랭글러 실현 등 렉스마크의 3대 트랜스포메이션 수요를 충족하기 위해 선정된 몇몇 재사용 가능한 기능을 바탕으로 구축됐다.

그러한 기능에 포함된 내용은 다음과 같다.

• 접근 및 통제를 현장 수준 내지 비즈니스 사용자의 소비 지점에서 관리하기 위한 보안 분류
• 적절한 데이터 처리(예: 암호화)를 현장 수준에서 또는 여러 현장의 조합을 대상으로 적용하기 위한 개인정보보호 지정
• 사용자가 수집된 데이터에 대해 취해야 할 행동을 시각적으로 표현할 수 있게 하고 운영 팀에게 파이프라인 인스턴스를 디버깅, 재시작 또는 되감기 하는 단일 유리창을 제공하기 위한 로우코드/노코드 파이프라인 개발
• 수집된 데이터 소스의 정의를 수립하기 위한 데이터 사전
• 소스에서 타겟까지 데이터에 대해 취한 행동을 담기 위한 데이터 족보
• 정제, 변환된 소비 가능한 비즈니스 데이터의 정의를 비즈니스 용어로 수립하기 위한 비즈니스 용어 사전

특히 큰 과제는 문화적 변화
코프는 PDT 구축에 어려운 기술적 과제들이 있었지만 문화적 변화가 유독 큰 과제였다고 말했다.

그는 “데이터 민주화라는 이 전체적인 개념은 훌륭하지만 이를 보안 관점, 개인정보보호 관점, 거버넌스 관점 등등을 전부 아울러 해내는 것은 매우 어려운 일이다”라고 전했다.

코프에 따르면 렉스마크의 데이터 영웅들은 대개 저마다의 노하우를 개발해 활용하고 있었다. 많은 경우 그들은 비즈니스의 특정 부분을 분석하기 위한 공식과 매크로와 피벗으로 특정 스프레드시트를 완벽하게 만드는 데 많은 시간을 쏟곤 했었다. 그런데 더 큰 이익을 위해 그것을 포기하라는 주문이 나타났던 것이다. 

그는 “우리는 특정한 비즈니스 수요 해결을 위해 데이터가 거쳐야 할 트랜스포메이션 여정을 한 사람이 알아내는 것을 원하지 않는다”고 전제하고 “우리가 원하는 것은 그 과정을 보다 체계적으로 만들고 모든 사람이 활용할 솔루션에 안에 넣는 것이다. 이는 정말이지 큰 변화다. 하루아침에 일어나지 않는 성질의 것이다”라고 덧붙였다. ciokr@idg.co.kr



2021.07.23

‘소수의 영웅적 활동 넘어서게’··· 렉스마크의 데이터 혁신 여정

Thor Olavsrud | CIO
매주 생성되는 테라바이트 단위의 데이터에서 비즈니스 가치를 뽑아내기 위해, 그리고 데이터 사일로를 제거하기 위해 렉스마크는 단일 엔드투엔드 데이터 소스 아키텍처를 구축했다. 
 
ⓒChris Lawton / Gerd Altmann (CC0)

글로벌 프린터 및 이미징 제품 제조회사 렉스마크 인터내셔널(Lexmark International)에서는 데이터가 매일 쏟아진다. 렉스마크 관리 인쇄 서비스만 해도 약 100만 대의 프린터와 복합기가 등록돼 있어 매주 테라바이트 이상의 데이터를 생성하고 있다. 현장에 보급된 600만 대 이상의 프린터 역시 고객이 동의한 경우 데이터가 렉스마크와 공유된다. 

그 데이터를 관리하고 그 데이터에서 인사이트를 얻는 일은 벅찬 일이었다. 이를 위해 회사는 ‘렉스마크 PDT(Product Digital Thread)’를 만들었다. PDT는 제품의 설계에서부터 재활용에 이르는 전체 생애주기에서 걸쳐 생성되는 실시간 데이터에 대한 실시간 통합 저장소 겸 감사 추적 시스템이다.

렉스마크 트랜스포메이션 제품 책임자 앤디 코프는 “(PDT 덕분에) 핵심 인쇄 부품은 물론 여타 하드웨어와 소모품 등이 생애주기에 걸쳐 활용되는 상호 연관 데이터가 생성되고 있다”라고 설명했다. 

그는 이어 “이것이 제대로 드러나는 곳은 애저(Azure) 데이터 레이크 내의 소위 원시, 정제, 소비 등의 계층이다. 이 3개의 데이터 계층은 비즈니스 사용자 종류의 전 범위에 걸쳐 사용자들을 지원하고 우리가 해야 하는 애널리틱스를 지원한다”라고 덧붙였다.


렉스마크의 데이터 과제
렉스마크의 힘든 점은 데이터 용량만이 아니었다. 렉스마크의 데이터가 CADD, PLM, ERP, CRM 등 글로벌 제조회사들의 대표적인 비즈니스 애플리케이션들에 걸쳐 퍼져 있는 것도 문제였다. 게다가 렉스마크의 공급망은 고도로 분산되어 있어서 제품의 설계, 제작, 입고, 유통을 위해 협력을 준비하려면 여러 벽을 넘어 데이터를 전달해야 한다.

코프는 “대규모 글로벌 제조업체가 다 그렇듯이 렉스마크의 비즈니스는 매우 데이터 집약적이다. 특히 이러한 특성이 코로나 사태로 확실히 더욱 커졌다”고 말했다. 

그는 이어 “당사의 가치 사슬은 공급업체의 공급업체에서부터 고객의 고객에 이르기까지 크게 확장되어 있다. 이처럼 확장된 가치 사슬을 통해 제품을 설계, 제조, 실현하는 방식을 비즈니스를 펼치고 있다. 사실 당사는 크게 보면 데이터 회사다”라고 말했다.

이러한 문제들 때문에 렉스마크는 수많은 일괄 처리 및 트랜잭션 통합 수단을 개발하여 소스 기기에서 저장소로의 데이터 이동, 회사와 협력업체 및 고객 간의 데이터 이동, 비즈니스 애플리케이션과의 통합, 그리고 입력, 기록, 소비 시스템에 걸친 마스터 데이터의 동기화를 다각적으로 시도했었다. 

그 결과, 많은 비즈니스 사용자들이 스스로 데이터 활용안을 개척해야 했다. 그리고 이렇게 커스터마이징된 추출물과 저장소에서 만들어진 데이터는 불가피하게 비즈니스 기능과 애플리케이션 내에 고립되곤 했다.

코프는 이로 인해 생애주기에 걸친 데이터 분석이 어려워졌다고 말했다. 생애주기에 걸친 데이터 분석은 보통 일회성으로 교차 기능 팀에서 실시했는데 분석 시간이 며칠 내지 심하면 몇 주나 걸렸다. 

고도로 전문화된 분석 방법을 강구할 수 있는 고급 비즈니스 사용자 데이터 랭글러들이 필요했지만 그렇다면 데이터 파악, 추출, 변환 및 분석 방법에 대한 지식이 그러한 고급 비즈니스 사용자 안에 고립된다는 뜻도 되었다. 즉 일부 전문가, 또는 영웅적 의지를 가진 소수만이 데이터를 제대로 활용하곤 했다. 

데이터 영웅 활동의 필요성 줄이기
코프와 그의 팀은 PDT를 활용해서 데이터 영웅 활동 수행의 필요성을 줄이고 비즈니스 사용자가 광범위하게 접근하여 소비할 수 있는 단일 종단간 데이터 진실 소스를 구축하고자 했다
.
문제 해결에는 기술뿐만 아니라 조직 개편과 재교육도 필요했다. 렉스마크는 최고 정보 및 기술 책임자(지금은 은퇴한 톰 이드) 산하에 IT 그룹과 소프트웨어 R&D 그룹을 합병한 뒤 그룹 내부에 정식 데이터 과학 및 애널리틱스(DS&A) 팀을 확장 CoP(Community of Practice)의 핵심으로 설립했다. DS&A 팀은 렉스마크의 데이터 영웅을 파악하여 발전시키는 일과 마이크로소프트 엑셀 및 VBA 툴을 R, 파이썬과 같은 툴로 대체시키는 일에 전념했다.

코프는 “당사의 데이터 관리 기술 또는 기능 측면은 모두 이 이니셔티브와 관련성을 가졌다”면서 “즉 당사의 전문 기술이 거의 전면적으로 재정비된 것”이라고 말했다.

렉스마크는 직원들의 전환을 돕기 위한 교육 제공에 힘썼다. 단 직원들은 많은 부분을 근무 중에 배워야 했다. 코프는 “근무 중 학습량이 엄청나게 많았다. 따라서 ‘빠른 실패와 실수를 통해 배우고 넘어가라’는 격언을 몸소 실천해야 했다”고 말했다.

이와 동시에 렉스마크는 내부 데이터 거버넌스 기능도 재점검했고 전사적 데이터 거버넌스 및 윤리(EDGE) 커뮤니티를 만들었다. 교차 기능 집행 팀이 EDGE 협의회를 구성하고 있다. EDGE 협의회는 데이터 관리 정책의 최종 검토와 승인을 담당한다. 또한, PDT의 지속적인 개선과 소비자 디지털 쓰레드와 같은 새로운 디지털 쓰레드 구축을 비롯한 렉스마크의 데이터 중심 프로젝트들을 대상으로 우선순위를 설정한다. 

EDGE 협의회는 비즈니스 기능 내에 데이터 집사 및 데이터 관리인을 파악하여 지정하는 일을 비롯한 데이터 역할 및 책임을 규정하는 작업도 감독한다.

PDT의 기능
PDT는 개인정보보호와 보안을 위한 설계, 운영을 위한 설계, 비즈니스 사용자 데이터 랭글러 실현 등 렉스마크의 3대 트랜스포메이션 수요를 충족하기 위해 선정된 몇몇 재사용 가능한 기능을 바탕으로 구축됐다.

그러한 기능에 포함된 내용은 다음과 같다.

• 접근 및 통제를 현장 수준 내지 비즈니스 사용자의 소비 지점에서 관리하기 위한 보안 분류
• 적절한 데이터 처리(예: 암호화)를 현장 수준에서 또는 여러 현장의 조합을 대상으로 적용하기 위한 개인정보보호 지정
• 사용자가 수집된 데이터에 대해 취해야 할 행동을 시각적으로 표현할 수 있게 하고 운영 팀에게 파이프라인 인스턴스를 디버깅, 재시작 또는 되감기 하는 단일 유리창을 제공하기 위한 로우코드/노코드 파이프라인 개발
• 수집된 데이터 소스의 정의를 수립하기 위한 데이터 사전
• 소스에서 타겟까지 데이터에 대해 취한 행동을 담기 위한 데이터 족보
• 정제, 변환된 소비 가능한 비즈니스 데이터의 정의를 비즈니스 용어로 수립하기 위한 비즈니스 용어 사전

특히 큰 과제는 문화적 변화
코프는 PDT 구축에 어려운 기술적 과제들이 있었지만 문화적 변화가 유독 큰 과제였다고 말했다.

그는 “데이터 민주화라는 이 전체적인 개념은 훌륭하지만 이를 보안 관점, 개인정보보호 관점, 거버넌스 관점 등등을 전부 아울러 해내는 것은 매우 어려운 일이다”라고 전했다.

코프에 따르면 렉스마크의 데이터 영웅들은 대개 저마다의 노하우를 개발해 활용하고 있었다. 많은 경우 그들은 비즈니스의 특정 부분을 분석하기 위한 공식과 매크로와 피벗으로 특정 스프레드시트를 완벽하게 만드는 데 많은 시간을 쏟곤 했었다. 그런데 더 큰 이익을 위해 그것을 포기하라는 주문이 나타났던 것이다. 

그는 “우리는 특정한 비즈니스 수요 해결을 위해 데이터가 거쳐야 할 트랜스포메이션 여정을 한 사람이 알아내는 것을 원하지 않는다”고 전제하고 “우리가 원하는 것은 그 과정을 보다 체계적으로 만들고 모든 사람이 활용할 솔루션에 안에 넣는 것이다. 이는 정말이지 큰 변화다. 하루아침에 일어나지 않는 성질의 것이다”라고 덧붙였다. ciokr@idg.co.kr

X