김진철의 How-to-Big Data | 빅데이터 조직과 시스템 (2)

CIO KR

CERN은 왜 오픈소스 컨퍼런스 관리 소프트웨어를 만들었나? – CERN의 Indico
앞서 자세히 소개한 그리드와 클라우드 컴퓨팅 기술, 그리고 팀 버너스 리의 월드 와이드 웹과 같이 현대 인터넷을 만든 다양한 정보 기술들이 탄생한 CERN은 입자물리학 연구소이지만 정보기술의 수준도 세계 정상이다. CERN에서 일하는 다양한 분야의 물리학자들은 다른 분야의 과학자들에 비해서 유난히 정보기술의 전문성이 높은 편이다.

CERN 내부에는 LHC Computing Grid를 포함한 유럽 인터넷, 연구망 허브 등의 정보 기술 인프라를 구축, 운영, 관리하는 CERN 컴퓨팅 센터가 있고, 이곳에 다양한 분야의 컴퓨터 과학자들과 정보기술 전문가들이 근무하고 있지만, 이들 외에도 많은 물리학자가 수준급의 프로그래밍 실력과 컴퓨터, 정보기술 전문 지식을 가지고 입자물리학 현상을 분석하는데 필요한 다양한 소프트웨어를 만들어 내고 있다.



CERN에서는 앞서 열 세번째부터 열 여섯번째 글에서 소개한 것과 같이 ROOT나 PROOF, CMS 검출기 온라인 소프트웨어인 XDAQ, LHC 컴퓨팅 그리드 서비스를 위한 WLCG 그리드 미들웨어 등 LHC 실험 장치와 빅데이터 분석을 위한 다양한 오픈소스 소프트웨어를 만들어 전 세계 공동 연구원과 입자물리학 연구원들에게 배포하고 있다. CERN에서 개발한 오픈소스 소프트웨어 중에 독특하면서 눈에 띄는 오픈소스 소프트웨어가 하나 있는데, 이것이 오늘 소개할 Indico라고 하는 소프트웨어이다.

Indico는 컨퍼런스와 워크숍 등의 다양한 학술회의의 프로그램, 참석자와 회의 자료를 등록하고 관리하기 위해 만든 오픈소스 소프트웨어이다. 실제로 LHC 국제 공동 연구와 관련된 많은 컨퍼런스와 워크숍, 회의가 Indico를 통해서 관리되고 있다. CERN에서 운영하는 Indico 서비스인 indico.cern.ch에 집계된 통계를 보면, 2018년 11월 15일 현재 Indico를 통해 관리된 컨퍼런스의 수만 1,629개, 워크숍의 수만 3,191개이고, LHC가속기의 국제 공동 연구와 관련된 회의만 해도 483,807개가 된다.

사실 학계에서 컨퍼런스를 열어서 연구성과를 발표, 홍보하고 비슷한 문제를 고민하는 연구원들끼리 의견과 정보를 교환하는 모습은 그렇게 유별난 것은 아니다. 하지만, 특정한 커뮤니티에서 학술회의 관리를 위해 꽤 오랜 시간 동안 오픈소스 소프트웨어를 개발해서 배포, 관리하고 있다는 것은 놀랄 만한 일이 아닐 수 없다. 



보통 특정한 연구분야에서 열리는 컨퍼런스는 많아야 수십 개 수준이다. 하지만, LHC 장치 및 실험에 관련된 컨퍼런스만 2000년 이후로 1,627개라는 것은 연간 평균 90개 이상의 컨퍼런스가 열렸다는 의미다. Indico가 개발된 2000년 초반에는 Indico를 통해 관리된 컨퍼런스가 많지 않았을 테니, 최근에 Indico를 통해 관리되고 있는 LHC관련 컨퍼런스는 연간 100개가 넘는다고 볼 수 있다. 실험 관련 회의가 지금까지 483,807개이니, 연간 평균 26,878개의 회의가 Indico를 통해 열리고 있다. Indico에 집계된 컨퍼런스와 회의만 저 정도이니, Indico를 사용하지 않은 회의나 컨퍼런스를 고려하면 실제로는 훨씬 더 많은 수의 컨퍼런스와 회의가 열리고 있다.

도대체 왜 CERN에서는 이렇게 컨퍼런스 관리 소프트웨어를 직접 만들 필요가 있었을까?

첫번째로, 당연한 얘기겠지만, LHC 국제 공동 연구를 수행하기 위해 개최되어야 하는 학술회의의 수와 종류가 엄청나게 많았기 때문이다.

LHC 가속기와 네 개의 검출기의 규모가 워낙 크고 장치의 복잡도가 높다 보니 관련된 분야의 전문가들이 모여 실험 장치 설계, 개발, 운영에 관한 이슈를 논의하기 위해서 CERN과 LHC 프로젝트는 엄청난 수의 회의를 개최하고 그 자료를 관리하여야 하는 문제에 부딪혔다. 회의의 숫자가 보통 연구분야에서 열리는 컨퍼런스나 워크숍의 수보다 훨씬 많은데, 위에서 잠깐 언급했다시피 컨퍼런스만 해도 2000년 이후로 1,627개, 회의만도 483,807개이니 CERN에서는 1년 내내 컨퍼런스와 회의만 열리고 있다고 해도 과언이 아니다.



LHC 가속기와 네 개의 검출기들의 규모가 워낙 크고 복잡하기 때문에 풀어야 하는 기술적인 문제의 종류와 수가 많기도 하지만, LHC 실험장치가 전 세계에서 처음으로 지어지는 거대 실험장치이기 때문에 오는 문제도 있다. 상품화되어 대량 생산 단계에 들어간 실험장치라면 이미 기술적인 문제는 어느 정도 해결되어 생산 및 개발 과정이 자동화, 또는 표준화가 되어 있어서 실험 장치 개발을 위해 해야 하는 일들이 어느 정도 분명하게 정의될 수 있지만, LHC 실험장치는 전 세계, 인류 역사상 처음으로 짓는 장치이다 보니 장치에 들어가는 부품과 구성품들 모두를 일일이 새로 설계, 개발, 테스트해야 하고 성공적인 동작을 위한 위험 관리까지 해야만 했다.

이렇게 LHC 실험 장치를 개발하기 위해 풀어야 하는 다양하고 복잡한, 그리고 엄청난 수의 기술적인 문제들은 결코 한 국가의 연구소, 한 기업, 한 조직이나 한 분야의 전문가들만이 해결할 수는 없는 문제들이었다. 이런 상황이다 보니 다양한 분야의 전문가들이 모여서 문제 해결을 의논해야 할 뿐만 아니라, 압도적으로 부족한 전문가들의 수를 늘리기 위해 전 세계의 관련 기술 전문가와 연구원들이 모여 어떻게 기술적인 문제들을 해결해 나갈 것인지 논의하고 고민하는 자리가 필요했다.

고에너지 물리학, 입자 물리학 분야만 해도, LHC 실험장치를 통해 답해야 할 물리학적 질문들이 많아서 표준 모델(the Standard Model), 초대칭 이론(supersymmetry theory), 양자색소역학(quantum chromodynamics), 스트링 이론(the String Theory) 등등 다양한 분야가 발전하고 있고 이들 각각의 전문 분야들을 위한 학술회의만도 다양하게 열리고 있다. 이뿐만 아니라, 극저온 상태에서 강자장을 만들어 무거운 양성자빔의 궤적을 제어하고 유지하는 LHC 주 가속기 설계를 위한 극저온 엔지니어링(cryogenics), 가속기 및 빔 물리학, 가속기 제어 엔지니어링등의 분야와, 앞서 살펴본 LHC 네 개의 검출기로부터 생산되는 데이터를 처리하기 위해 필요한 빅데이터 처리, 분석 시스템을 위한 컴퓨터 과학, 인공지능 및 기계 학습, 분산 컴퓨팅 시스템, 네트워크, 컴퓨터 아키텍처 등등의 다양한 컴퓨팅 분야 전문가들이 협업해야 하는데, 이들 각 분야만 해도 다양한 규모의 많은 수의 학술회의가 필요하다.

사정이 이렇다 보니, 매번 컨퍼런스를 열 때마다 분야별로, 컨퍼런스별로 컨퍼런스를 관리하는 소프트웨어를 일일이 개발하는 것은 엄청난 낭비였음이 분명하다. 이에 더해서, 이렇게 다양한 분야의 기술적인 논의가 LHC 실험을 위한 문제 해결의 장으로서 일관성 있게 기능하고, 다양한 분야의 전문가와 연구원들이 LHC 실험장치의 성공적인 건설과 운영, 신뢰성 있는 동작을 통한 예정된 실험의 성공적인 수행이라는 공동의 목적을 향해 역량과 뜻을 모으게끔 하기 위해서는 표준화된 형식과 프로세스, 시스템으로 각종 학술회의를 체계적으로 관리할 필요가 있었다. 이런 배경에서 Indico의 개발이 추진되었다.

두 번째로, LHC 실험과 관련된 각종 학술회의의 발표 자료 및 논문, 보고서 등의 기술 문서와 자료들을 체계적으로 수집, 보존하고 관리할 필요가 있었다.

LHC 프로젝트와 관련해서 워낙 많은 수의 기술 자료가 작성, 발표, 공유되다 보니, 개별 컨퍼런스나 워크숍, 회의 자료를 회의마다 다른 방식으로 수집하고 보관해서는 회의 현장에서 이루어지는 수많은 중요한 기술적인 논의 및 의사 결정에 대한 기록과 자료를 체계적으로 보존, 관리, 참조할 수 없었다. 이를 위해서는 통일되고 일관된 방식으로 자료를 수집, 저장, 관리할 수 있는 시스템이 필요했는데, 바로 이를 위해 Indico가 개발된 것이다.

보통 LHC 프로젝트와 관련된 학술회의와 기술 워크숍에 가면 하루만 하는 회의라고 하더라도 수많은 보고서, 논문, 발표 자료 및 기술 자료가 쏟아져 나오게 된다. LHC 프로젝트에서 직접 일하지 않는 연구원이라고 하더라도 컨퍼런스나 회의에 초청을 받아 연사로서 발표하는 경우도 많다. LHC 프로젝트에 직, 간접적으로 참여, 기여하는 다양한 연구원과 전문가들의 기술적인 견해와 연구 성과가 언제 어떤 방식으로 LHC 장치 디자인 및 개발, 데이터 분석에 중요한 단서를 제공하거나 기여할지 예측할 수 없기 때문에 가능하면 모든 회의의 발표자료와 회의록, 참여자들과 회의 개요 등의 정보를 하나의 시스템에서 체계적으로 저장, 관리할 필요가 있었다.

각종 회의에서 수집된 발표자료와 발표 영상 자료, 회의록들도 워낙에 회의 종류와 숫자가 많다 보니 LHC에서 수집, 처리, 보관해야 하는 또 하나의 빅데이터가 되었다. 이들 LHC 관련 회의에서 나오는 기술 자료 빅데이터를 처리하기 위해서는 확장성 있는 컨퍼런스 관리 시스템이 필요했는데, 웹 기술의 총 본산이었던 CERN이 자신이 가진 웹 기술 전문가들의 전문성을 총동원하여 확장성 있고 유연한 컨퍼런스 관리 소프트웨어인 Indico를 만들게 된 것이다. 
 

---------------------------------------------------------------
김진철 칼럼 인기기사
-> 김진철의 How-to-Big Data | 연재를 시작하며
-> 김진철의 How-to-Big Data | 빅데이터 활용의 근본적인 질문 - 해결하려는 문제가 무엇인가?
-> 김진철의 How-to-Big Data | 빅데이터 수집에 관한 생각 (1)
-> 김진철의 How-to-Big Data | 빅데이터 수집에 관한 생각 (2)
-> 김진철의 How-to-Big Data | 빅데이터 수집에 관한 생각 (3)
---------------------------------------------------------------

세 번째로, LHC 실험장치 개발과 운영을 위한 비용도 만만치 않은데, 이를 위한 회의 개최 비용과 커뮤니케이션 비용도 최대한 절감할 필요가 있었다.

LHC 실험 장치와 컴퓨팅 인프라 자체만도 건설과 운영 비용이 천문학적으로 들어갔지만, LHC 프로젝트를 수행하는 인력들의 인건비와 이들 인력이 프로젝트를 위해 서로 의사소통하고 협업하기 위한 시스템을 갖추고 운영하는 데에도 많은 비용이 들어갔다.

 


흔히 전문 컨퍼런스 관리(Professional Conference Management; PCM) 회사들에 컨퍼런스 운영을 외주를 줄 경우에 컨퍼런스 등록과 자료 수집, 관리를 위한 IT 시스템 구축에 많은 비용이 들어가는 경우가 많다. 개별 컨퍼런스별로 이들 PCM 회사들에 외주를 주게 되면 기술 커뮤니케이션 비용만도 상당히 많은 비용이 들어가게 된다.

CERN과 LHC 프로젝트에서 일하는 전문가들 대부분이 소프트웨어 개발이나 컴퓨팅 기술에 익숙한 IT 전문가들이기 때문에, 오히려 PCM 회사들의 컨퍼런스 전문 IT 시스템을 사용하는 것보다 이들 LHC 프로젝트의 IT 전문가들이 컨퍼런스를 체계적으로 관리할 수 있는 소프트웨어를 개발, 배포하는 것이 프로젝트 비용 절감에도 도움이 되었다.



비용 절감의 효과뿐만 아니라, 다양한 PCM회사들의 각기 다른 컨퍼런스 관리 시스템을 사용하는 것보다는, CERN과 LHC 프로젝트에서 일하는 소프트웨어 엔지니어들이 LHC 프로젝트에서 흔히 일어나는 기술 회의와 컨퍼런스, 워크숍의 커뮤니케이션 특성에 맞게 요구사항을 발견하고 이 LHC 프로젝트만의 요구 사항에 맞게끔 컨퍼런스 관리 시스템을 만드는 것이 기술 커뮤니케이션 관리에 더 효과적인 측면도 있다. 이를 통해서 LHC 프로젝트의 커뮤니케이션 비용과 노력을 상당히 줄일 수 있었다.

마지막으로, LHC 실험 자체가 인류가 역사상 풀어본 적이 없는 난제로서 다양한 분야의 뛰어난 전문가들과 연구원들이 그들의 창의성과 역량을 최대한으로 발휘하여 해결책과 그 의미를 같이 고민하는 자리가 필요했다. 이들 전문가와 연구원이 손쉽게 회의를 조직, 운영하고 문제 해결과 연구를 위한 토론과 의사소통에 집중하게 도울 수 있는 시스템이 필요했다.

LHC 프로젝트에서 일하는 연구원과 전문가는 지구상에서 가장 똑똑하고 뛰어난 재원들이라고 보아도 무방하다. 과학, 기술 분야에서는 우주 과학 분야 다음으로 똑똑하고 뛰어난 엘리트들만이 모여 있다고 보아도 된다. 이들 LHC 프로젝트의 과학, 공학 엘리트들이 자신의 능력을 최대로 발휘하여 LHC 실험을 수행하기 위해서는 본연의 연구개발 업무 외의 소모적인 업무들로부터 해방시켜줄 수 있는 다양한 지원과 시스템이 필요하다.

LHC 프로젝트를 같이 수행하는 동료 연구원들과 열띤 토론, 기술적인 논의를 하는 컨퍼런스, 워크숍, 회의들은 LHC 연구원이 자신이 혼자서는 풀 수 없는 과학, 기술적인 난제들을 동료 연구원들과 함께 풀어나가기 위해서 꼭 필요한 일이기도 하지만, 회의를 조직하고 준비하는 과정에서 많은 시간과 노력을 필요하기 때문에 썩 달갑지만은 않은 일이기도 하다.



이렇게 컨퍼런스와 각종 회의를 체계적으로 조직하고 운영을 도울 수 있는 Indico와 같은 시스템은 LHC의 엘리트 과학, 기술자들이 자신들 고유의 연구개발 업무에 집중하기 위해서도 꼭 필요한 시스템이다. LHC의 연구원들은 자신들의 시간과 노력을 절약하고 효과적으로 일에 집중하기 위해 컨퍼런스, 워크숍, 회의 운영과 데이터 관리를 체계적이고 자동화된 방식으로 수행할 수 있는 자신들만의 솔루션을 만들어냈다.

Indico 덕분에 LHC 연구원들의 창의적이고 열정적인 협업이 체계적으로 기록이 남겨지고 보존될 수 있었고, LHC 건설과 운영의 다양한 기술적인 문제들이 창의적으로 해결될 수 있었다. Indico는 CERN과 LHC 연구원들의 창의적이고 역동적인 회의의 현장과 역사를 담아내고 기록하는 LHC와 CERN의 또 하나의 명물로서 자리 잡았다.

마지막으로 Indico와 함께 하나 더 소개하고 싶은 것은 CERN과 LHC 실험의 유별나게 많은 회의를 지원하기 위해 CERN과 LHC에서 직접 개발한 또 하나의 기술인 화상 회의 기술이다. CERN은 현재 우리가 사용하는 시스코의 웹엑스(WebEx), 시트릭스의 고투미팅(GoToMeeting) 등과 같은 화상 회의 서비스 기술이 나타나기 한참 전인 1995년부터 VRVS(Virtual Room Videoconferencing Service)라는 화상 회의 기술을 만들어 연구망을 통해 서비스하였다. VRVS는 10년간 CERN과 LHC 실험에 참여하는 세계 각국의 연구팀을 지원하고 2008년에 셧다운 되었다[7-8].

VRVS가 셧다운된 후에는 CalTech의 고에너지 물리학 연구팀이 H.323표준을 기반으로 만든 EVO가 쓰였다. EVO는 LHC 가속기가 시운전되었던 2008년부터 서비스를 시작해서 최근까지 서비스를 진행하였고, 최근에는 CERN에서 개발한 H.323/SIP 화상 회의 서비스인 Vidyo가 서비스되고 있다[7-8].

EVO 및 Vidyo는 Indico를 통해 화상 회의 일정 예약과 관리가 같이 될 수 있도록 Indico 기능에 통합되어 지원되고 있다. LHC 실험의 연구원들이 시간, 공간을 제약을 넘어 회의할 수 있도록 Vidyo 서비스는 2017년 11월에 역대 최대 화상 회의 지원 숫자인 한달에 2만 4천건이 넘는 화상 회의를 지원하였고, 2018년 10월에만 11,400건이 넘는 화상 회의와 42,300명이 넘는 화상 회의 접속을 제공하였다[7-8].

Indico와 VRVS, EVO, Vidyo 등의 회의 지원 도구들을 직접 만들어 쓸 정도로 LHC 실험의 연구원들은 적극적으로 서로의 생각과 아이디어를 공유하고 토론하였다. LHC 연구원들 간의 만남과 토론을 위해 Indico와 Vidyo까지 만들어낸 CERN이 앞으로는 3D 홀로그램을 이용한 텔레프레즌스(telepresence) 기술과 원격 데이터 가시화와 같은 기술로 새로운 회의 문화를 만들게 될까? 앞으로 지켜보도록 하자.


빅데이터와 데이터 과학을 통한 비즈니스 혁신 유도의 방법 – 구성원들의 만남과 교류를 촉진하라
최근 발간된 조지타운 대학교의 컴퓨터공학과 교수인 칼 뉴포트의 <딥워크>라는 책에는 “에우다이모니아 머신”에 관한 얘기가 나온다. 데이비드 드웨인이라는 건축과 교수가 “심층적 몰입(딥워크)”을 유도할 수 있는 공간으로서의 건축물로서 저자인 칼 뉴포트 교수에게 펜으로 그려 설명하는 장면이 책에 소개되는데, 데이비드 드웨인 교수의 에우다이모이아 머신은 다음과 같이 묘사된다[4].

에우다이모니아 머신은 복도가 없는 다섯 개의 방으로 구성되어 있다. 첫번째 방은 “갤러리”로 에우다이모니아 머신에서 창출된 딥워크의 결과물들이 전시된다. 이러한 전시물들을 통해 새로운 작업에 대한 영감과 함께 “유익한 스트레스와 압박의 문화”를 창출한다[4]. 두 번째 방은 살롱으로, 바에서 고급 커피와 음료수를 즐길 수 있고 와이파이나 소파와 같은 것을 비치해 아이디어를 떠올리고 영감을 창출하기 위한 공간이다. 세 번째 방은 도서관으로, 이 에우다이모니아 머신에서 창출된 작업들과 관련된 자료들을 모두 모아 놓고 열람할 수 있게 만든 공간으로, 에우다이모니아 머신의 “하드 드라이브”에 해당한다. 네 번째 방은 사무실로 일반적인 사무공간과 같이 화이트보드 등을 설치한 회의실과 큐비클로 구분된 사무 공간이 꾸며지며, 일반적인 사무 업무나 피상적인 업무를 할 수 있는 공간이다.

  마지막 다섯 번째는 “심층적 작업실”로 불리는 것으로, 에우다이모니아 머신의 궁극적인 목적을 실현하기 위한 공간이다. 가로 1.8미터, 세로 3미터의 공간에 45센티미터 두께의 방음재로 구성된 벽으로 만들어지며, 외부의 모든 방해요소로부터 작업자를 차단하여 온전한 몰입이 이루어지도록 한다.

에우다이모니아 머신은 딥워크를 통해 창조적인 일을 하기 위한 공간으로서, 단계적으로 딥워크를 유도하여 창의적인 일을 할 수 있도록 설계된 공간이다. 아직 실제로 지어지지 않은 데이비드 드웨인 교수의 상상 속에서만 존재하는 건축물이지만, 창의성을 극대화할 수 있는 공간으로서 던져주는 시사점이 크다고 할 수 있다.

최근 구글, 페이스북 등의 IT 플랫폼 기업들을 중심으로 구성원들의 창의성과 역량을 최대한으로 끌어내는 업무 공간과 환경이 어떤 것인지에 대해 많은 관심과 시도가 이어지고 있다. 구글은 구성원들이 창의적으로 자유롭게 일할 수 있도록 놀이공간과 같은 아기자기한 공간으로 업무 공간을 구성하고, 휴식과 일이 적절하게 병행될 수 있도록 업무 공간 곳곳에 휴식 공간과 카페, 게임룸, 수영장 및 운동 시설 등이 잘 갖춰진 것으로 유명하다.

페이스북은 구성원들 간의 우연한 만남을 통해 창의적이고 새로운 아이디어가 나타날 가능성을 극대화하기 위해 전체 건물이 하나의 큰 공간으로 이루어진 형식으로 신사옥을 짓고, 모든 구성원이 이 하나의 공간에서 같이 일하도록 했다. 옛 선마이크로시스템 본사 사옥에 꾸며진 페이스북의 신사옥 옥상에는 축구장 7개 크기의, 400그루의 나무를 심은 거대한 지상 정원을 꾸며 휴식을 취할 수 있도록 했다.

칼 뉴포트의 “딥워크”라는 책에 나오는 에우다이모니아 머신은 깊은 몰입과 집중을 통해 창의성과 업무 효율을 극대화할 수 있는 공간에 대해서 얘기하고 있고, 최근 구글과 페이스북 등의 실리콘밸리 기업들의 개방형 업무 환경은 가능하면 많은 사람이 우연히 자주 접촉하고 아이디어를 나눔으로써 창의적이고 새로운 사업 아이디어로 발전할 수 있도록 환경과 공간을 조성하는 것과 관련되어 있다. 그렇다면, 과연 어떤 것이 기업에게 더 효과적이고 적합할까?

모든 경우에 맞는 답은 있을 수 없겠지만, 우리가 생각할 수 있는 하나의 답은 위 두 경우의 양극단에 해당하는 것이 정답은 아닐 것이다. 기업의 발전과 성장에 도움이 되는 창의적인 아이디어를 발전시키기 위해 모든 구성원을 몰입과 집중을 위한 극단적인 고립의 환경에서 일하게 하면 협업을 통한 발전과 성장의 기회가 차단되고, 투명하지 못한 의사소통만이 넘쳐나게 될 것이다.

그렇다고 집중할 수 있는 고립된 공간이 전혀 없이 페이스북 신사옥과 같은 방식으로 모든 공간이 개방되면, 깊은 몰입을 통한 창의적인 아이디어의 계발과 효율적인 업무 처리에서 오는 기민함은 역시 기대하기 힘들 것이다. 데이터 기반의 신사업을 위한 업무 환경은 위 양극단의 중간 지점의 어디쯤 해당할 것이다.

빅데이터를 활용하여 새로운 신사업을 개척하려는 기업들이 왜 이런 것을 고민해야 할까? 우리 회사는 구글이나 페이스북 같은 대단한 회사도 아닌데, 왜 꼭 우리 회사가 그런 창의적인 아이디어를 낼 수 있고 깊게 몰입할 수 있는 업무 환경에 대해서 고민해야 할까?

그 이유는 빅데이터를 다루어 기업에 이로운 새로운 통찰과 지식을 발견하는 과정은 결국 과학적 지식을 추구하는 과정과 크게 다르지 않은 고도의 지적 능력이 있어야 하는 전문 업무이기 때문이다. 빅데이터를 비즈니스의 요구 사항에 맞게 수집, 가공, 분석하는 업무는 고도의 집중력과 전문 지식이 필요한 지적 노동이다. 이런 전문적인 지적 노동을 통해 만들어낸 산출물들이 기업에 도움이 되는 성과물이 되기 위해서는 이런 전문적인 지적 노동을 하는 사람들이 어떤 환경에서 일할 때 가장 큰 생산성을 보이는지 고민할 필요가 있는 것이다.

빅데이터를 다루는 데이터 엔지니어들, 데이터 과학자들, 그리고 소프트웨어 엔지니어들이 기업의 비즈니스에 가장 크게 공헌할 수 있도록 하는 환경은 어떤 환경일까? 그 답은 칼 뉴포트의 “딥워크”라는 책에 나오는 MIT 대학의 빌딩 20에 대한 사례로부터 찾을 수 있다.

MIT 대학의 빌딩 20은 요즘 회자되는 구글식의 화려하고 아기자기한 업무 공간도 아니고, 페이스북식의 개방형 업무 공간도 아니다. 칼 뉴포트의 표현을 따르면 소위 “거점형 공간”이라고 불리는 스타일의 공간으로, 고도로 집중할 수 있는 고립된 공간들이 여러 사람이 공유하고 자주 마주칠 수 있는 복도와 같은 공용 공간을 통해 연결된 구조다.

이런 “거점형 공간”의 중간중간에 서로 만나서 의견을 교환하고 깊은 대화를 할 때 손쉽게 아이디어를 공유하고 나눌 수 있는 표현 공간, 측 화이트보드 같은 것들이 놓여 있는 회의 공간이 적절하게 갖추어졌을 때 몰입을 통한 창의성과 협업과 아이디어 교환을 통한 창의적인 아이디어의 발전이 극대화된다고 필자인 칼 뉴포트는 주장하며, 본 글을 쓰고 있는 필자도 동의하는 바이다.

사실 “거점형 공간”은 유별나게 특별한 공간은 아니다. 요즘 대부분 대기업에서는 많이 사라지기는 했지만, 여전히 대부분 조직에서 채택하고 있는 공간 형태이기도 하다. 이런 공간이 빅데이터 비즈니스에 걸맞은 창의성의 원천이 되는 공간으로서 역할을 다하기 위해서는 이 공간을 사용하는 구성원들의 역량이 정말 중요한데, 이런 구성원들의 자질, 즉 데이터 과학자 및 빅데이터 소프트웨어 엔지니어의 역량과 자질에 대해서는 본 글에 이어지는 다음 연재에서 좀더 자세하게 살펴보기로 하자.

그렇다면 이런 거점형 공간을 일반 조직에서 어떻게 구현하고 활용할 수 있을까? 이미 많은 기업에서 개방형 업무 공간임을 표방하며 사용하고 있는 큐비클로 구분된 업무 공간을 또다시 위와 같은 거점형 업무 공간으로 많은 비용을 들여서 다시 만들어야 할까? 업무 공간에 많은 비용을 사용할 수 없는 스타트업들과 기업들이 거점형 공간의 효과를 볼 수 있는 다른 대안은 없을까?

거점형 공간을 당장 비용을 들여 만들 수 없는 기업들이 손쉽게 거점형 공간의 효과를 일부 누릴 방법이 바로 컨퍼런스와 같은 형태의 회의다. 빅데이터를 활용하는 기업이 업무 공간에 많은 투자를 해서 당장 업무 공간을 개선할 수 없다면, 일정한 시간 간격을 두고 특정한 주제에 대해 집중적으로 논의하면서 같이 문제를 해결해 나가는 컨퍼런스나 해커톤 스타일의 회의나 행사를 활용해 볼 것을 필자는 권한다.

CERN의 경우 연구 공간도 이미 거점형 공간 형태로 대부분 갖추어져 있고, 특정한 주제에 대해 깊은 관심을 가지고 연구하는 관련 연구원들이 한자리에 모여서 해결책을 집중적으로 논의하는 컨퍼런스, 워크숍의 이점도 적극적으로 활용하고 있으니, 힉스 입자 발견과 같은 성과를 내는 것도 어떻게 보면 당연한 일이라 할 수 있을 것이다.

CERN과 LHC 공동 연구 프로젝트의 경우에도 주기적으로 열리는 수많은 컨퍼런스, 워크숍과 회의를 통해 특정한 주제에 대해 집중적으로 해법을 찾는 시간을 가지고, 이런 기간을 동료 연구원들과의 교류와 아이디어 교환에 활용하는 집단 지성의 시간으로 활용한 후에는 다시 본인의 업무 공간으로 돌아가 본인의 업무와 문제를 몰입, 집중하여 본인만의 해법을 다시 고민하고 찾아 나간다. 의도적인 고립을 통한 몰입과 집중, 협업을 통한 창의적인 아이디어 개발의 과정이 적절하게 균형을 이룬 것이 LHC 실험에서 힉스 입자를 발견하게 한 원동력이라고 할 수 있다.

그렇다면, 빅데이터 비즈니스를 효과적으로 수행하기 위해 어떻게 구성원들의 효과적인 몰입과 집중, 구성원 간 창의적인 의사소통을 만들 수 있을까? Indico라는 컨퍼런스 관리 전문 소프트웨어를 만든 CERN과 LHC 국제 공동 연구 프로젝트의 사례를 보면서 필자는 아래와 같이 제안하고 싶다.

첫번째로, 많은 컨퍼런스가 열리는 통상적인 방법과 같이 우선 기간을 정하고, 보통 일하는 장소에서 떨어진 새로운 장소에서 관련된 사람들이 모두 모여 회의하도록 한다.

컨퍼런스가 열리는 기간을 정하고, 관련된 사람들이 평상시 일하는 업무 공간이 아닌 다른 공간에 별도로 모이는 것은 논의하고자 하는 특정한 주제에 대해 참석한 사람들의 집중력을 높이려는 방법이다. 평상시 일하는 공간이 아닌 다른 공간에서 회의함으로써 새로운 자극을 주어 창의성과 문제 해결에 대한 의지를 고양하기 위한 방법이기도 하다.

두번째로, 참석하는 모든 사람이 컨퍼런스에 자기만의 분명한 기여를 만들고 참석하도록 한다.

참석하는 사람들이 컨퍼런스에서 논의하는 주제에 대해서 자기만의 분명한 기여가 없이 참석하게 되면 회의에 대한 집중력이 떨어지고, 같이 논의하는 주제에 대해서 자신만의 입장을 분명하게 할 수 없어 문제 해결을 위한 생산적인 논의를 하기가 어려워진다. 

LHC 실험과 관련된 학술회의들은 통상적인 학술회의와 같이 논문이나 발표의 형태로 참석자들이 자신만의 기여를 하도록 독려하고, 참석자들도 어떻게 해서든 자신만의 기여를 만들기 위해 노력한다. LHC 실험뿐만 아니라 과학계에서 어떻게든 자신만의 기여를 논문이나 발표를 통해 학술회의에서 만들려고 하는 것은 자신의 성취와 업적을 동료 과학자들에게 알리고, 이를 통해 자신이 원하는 연구를 하기 위한 학계의 인정과 지원, 연구비 수혜의 가능성을 높이기 위한 현실적인 이유도 있다.

무엇보다도 학술회의에서 자신만의 기여를 논문이나 발표를 통해서 만드는 이유는 자신이 가진 아이디어와 생각을 많은 동료 연구원들 앞에서 발표함으로써 자신의 입장과 업적이 과학 커뮤니티에서 어떤 위치에 있는지를 확인하고 앞으로의 연구 방향을 수립하기 위해 필요한 동료 연구원들의 피드백과 의견을 들을 수 있기 때문일 것이다.  이런 동료들로부터의 피드백과 의견과 함께 자신이 분명하게 표현한 자신만의 아이디어와 기여가 동료들과 같이 고민하는 문제에 대해 보다 집중적이고 생산적인 논의와 협업을 가능하게 하기 때문에 자신만의 기여를 분명하게 하는 것은 반드시 필요하다.

컨퍼런스에 무임승차하는 사람이 많을수록 컨퍼런스의 분위기가 맥이 빠지고 모이는 시간이 오히려 시간 낭비가 될 가능성이 높다. 참석하는 모든 사람이 자신만의 기여를 할 수 있도록 독려하고, 자신만의 기여를 분명하게 하는 사람이 컨퍼런스를 통해 보상을 받을 수 있도록 잘 조직하는 것이 매우 중요하다.

세번째로, 컨퍼런스를 새로운 아이디어와 생각을 풍성하게 경험할 수 있는 축제와 놀이의 장으로 만드는 것이 좋다.

컨퍼런스가 지나치게 심각하고 경직되면 오히려 참석하는 구성원들이 창의적인 생각을 하기가 어려울 수 있다. 많은 컨퍼런스들이 회의 중간중간에 다양한 형태의 파티와 관광, 참석자들 간의 교류와 친밀감을 높일 수 있는 행사를 꼭 같이하게 되는데, 이러한 행사들은 참석자들 간의 네트워킹의 목적도 있지만, 집중적인 회의를 통해 지친 정신과 몸에 휴식을 주어 회의 기간의 논의를 좀더 생산적으로 만들려는 의도도 있다.

컨퍼런스 분위기를 지나치게 경쟁적으로 만드는 것보다는, 다양한 아이디어들이 자연스럽게 흘러넘치도록 만들고 참석자들이 다양한 아이디어들을 부담 없이 즐길 수 있게 만드는 것이 창의적인 새로운 비즈니스 아이디어를 만들기 위한 컨퍼런스 개최 원래의 의도를 더 잘 살릴 수 있다.

마지막으로, 컨퍼런스 및 워크숍과 같은 집중 회의의 결과에 대해 반드시 회의록이나 논문, 보고서, 발표 자료의 형태로 기록을 남기고, 이러한 컨퍼런스와 집중 회의의 결과를 다시 찾아보기 원하는 사람들이 언제 어디서나 찾아볼 수 있도록 체계적으로 잘 보관, 관리하도록 한다.

빅데이터 비즈니스를 하는 기업들이 컨퍼런스와 워크숍 등의 집중 회의를 활용해 데이터 과학자들과 빅데이터 엔지니어, 데이터 분석가 및 비즈니스 전략가 간의 협업을 의미 있게 만들기 위해서는 체계적으로 회의 결과와 산출물을 보관, 관리하는 시스템이 반드시 필요하다. 회의 때 논의 했던 내용이 회의가 끝난 후 실행, 구현되기 위해서는 참석한 모든 사람이 회의 내용에 대한 자료를 언제든지 찾아보고 다시 검토할 수 있도록 잘 관리하는 것이 필요하다.

다행히도 CERN과 LHC 연구원들이 이런 고민을 해결해줄 수 있도록 Indico라는 훌륭한 컨퍼런스 관리 전문 소프트웨어를 오픈소스 소프트웨어로 만들어냈다. 필자도 현재 일하는 SK텔레콤에서 업무와 관련된 회의나 컨퍼런스를 조직하고 자료를 관리하는데 Indico를 사용하고 있는데, 워낙에 잘 디자인해 놓은 탓에 큰 노력을 들이지 않고 체계적으로 회의를 조직하고 회의 자료를 관리하고 있다. 이 글을 읽는 독자분들도 꼭 사용해 보시길 바란다. (Indico는 https://getindico.io에서 얻을 수 있다.)

빅데이터 비즈니스 시스템과 인프라의 진정한 가치를 만들어 내는 데이터 과학자와 빅데이터 엔지니어, 빅데이터 비즈니스 전략가 간의 협업과 창의성을 높이는 도구로서 창의적인 업무 공간과 컨퍼런스와 같은 협업 기회는 비즈니스의 성패에 큰 영향을 줄 수 있는 중요한 요소이다. LHC 실험에서 열리는 수많은 컨퍼런스와 워크숍, 회의를 통해 LHC 연구원들이 자신들의 창의적인 에너지를 모아 힉스 입자를 찾아내어 과학사의 큰 획을 그었듯이, 빅데이터를 자신들의 비즈니스에 적극적으로 활용하여 성공적인 비즈니스를 만들고 싶은 기업들도 컨퍼런스와 같은 형식의 집중 회의를 효과적으로 잘 활용해보자. 여러분의 조직에 데이터 기반 의사 결정과 창의적인 기업 문화를 정착시키는 데 크게 도움이 될 것이다.

[참고문헌]
[1] 김진철, “LHC에서 배우는 빅데이터와 machine learning 활용 방안”, 2016년 9월 28일, A CIO Conversation for Technology Leadership – Breakfast Roundtable 발표 자료
[2] Conferences, Indico CERN. (https://indico.cern.ch/category/6741/)
[3] Experiments Meeting, Indico CERN. (https://indico.cern.ch/category/6740/)
[4] 칼 뉴포트, “딥 워크”, 민음사, 2017.
[5] 천예선, 민상식, “칸막이 제로…페이스북 신사옥이 소박하고 실용적인 이유”, 슈퍼리치, 2015년 11월 20일자
[6] Indico - The effortless open source tool for event organization, archival and collaboration, https://getindico.io .
[7] João Fernandes, “Videoconference@CERN,” GEANT Educonf Workshop 18th-19th October 2010, Lisbon, Portugal, 2010.
[8] AVC Section Dashboards – Vidyo, http://avc-dashboard.web.cern.ch/vidyo .

*김진철 박사는 1997년 한국과학기술원에서 물리학 학사, 1999년 포항공과대학교에서 인공신경망에 대한 연구로 석사 학위를, 2005년 레이저-플라즈마 가속기에 대한 연구로 박사 학위를 받았다. 2005년부터 유럽입자물리학연구소(CERN)의 LHC 데이터 그리드 구축, 개발에 참여, LHC 빅데이터 인프라를 위한 미들웨어 및 데이터 분석 기술을 연구하였다. 이후 한국과학기술정보연구원(KISTI), 포항공과대학교, 삼성SDS를 거쳐 2013년부터 SK텔레콤에서 클라우드 컴퓨팅과 인공지능 기술을 연구하고 있다. 빅데이터와 인공지능 기술의 기업 활용 방안에 대해 최근 다수의 초청 강연 및 컨설팅을 수행하였다. ciokr@idg.co.kr