2018.12.28

김진철의 How-to-Big Data | 빅데이터 조직과 시스템 (3)

김진철 | CIO KR
LHC 실험을 수행하는 물리학자들과 연구자들의 특성
지금까지 LHC 실험을 위한 만든 LHC 가속기와 네 개의 검출기, 그리고 데이터 가공 및 분석을 위한 LHC 데이터 처리 시스템과 WLCG 그리드 컴퓨팅 기술을 소개하면서 빅데이터 기술의 모든 요소를 갖추고 있는 LHC 프로젝트의 면면을 살펴보았다. LHC 빅데이터 인프라의 모든 것이 중요하고, 어느 하나라도 제대로 동작하지 않으면 LHC에서 생산되는 수백 페타바이트의 빅데이터를 제대로 처리하기는 불가능하다고 얘기했다. LHC 빅데이터 인프라의 모든 것이 다 중요하지만, 무엇보다도 중요한 것은 이런 LHC 빅데이터 인프라를 만들어낸 사람들, 그리고 이런 LHC 빅데이터 인프라를 이용해 우주와 물질을 지배하는 근본 법칙과 통찰을 만들어내는 사람들, 즉 LHC 연구자들이다.

LHC 연구자들이 그들의 창의성과 역량을 헌신적으로 발휘하지 않았더라면 LHC 실험 장치와 빅데이터 인프라는 존재하지 못했을 것이고, LHC 실험장치에서 생산된 데이터를 이용해 힉스 입자가 존재하는지 여부도 확인하지 못했을 것이다. LHC 프로젝트의 꽃은 다른 어떤 요소보다도 바로 LHC 실험을 위해 일하는 과학자들일 것이다. 오늘은 LHC 실험을 위해 일하는 과학자들의 특성을 같이 살펴보면서, 빅데이터를 활용하는 데이터과학자들이 어떤 사람들이고 어떤 특성을 가진 사람들인지, 이들을 어떻게 일할 수 있도록 해야 빅데이터 비즈니스를 수행하는 조직이 성과를 낼 수 있을 것인지 같이 고민해보도록 하자.

LHC 과학자들은 다양한 분야의 전문가들로 구성되어 있지만, 가장 많은 비중을 차지하고 있는 사람들은 LHC 실험장치를 이용해 실험 입자 물리학을 연구하려는 물리학자들이다. 이들 LHC 물리학자들이 쉽게 말하자면 데이터과학자들이라고 볼 수 있다. 사람마다 편차가 많고, LHC 장치의 복잡성 때문에 물리학자들이 모든 영역의 기술개발을 하지는 못하지만, 그래도 LHC 실험 장치의 디자인부터 개발, 데이터 분석까지 대부분 영역에서 영향력을 발휘하고 실제로 연구를 수행하는 사람들은 LHC 실험 물리학자들이다.

LHC 물리학자들은 그 자신이 입자 물리학과 입자 물리 현상학의 전문가, 즉 도메인 전문가이기도 하지만, 자신이 관심을 가지고 연구하는 문제를 풀기 위해 필요한 기술과 공학분야에도 정통한 사람들이 많다. 기본적으로 과학기술 계산(scientific computing)과 데이터 분석을 위한 소프트웨어 개발 및 프로그래밍 소양은 갖추고 있고, 그리드 컴퓨팅, 웹 기술 기반 분산 시스템 개발 등의 IT 기술에도 상당한 실력을 갖추고 있는 경우가 많다. 검출기 시스템을 개발하는 LHC 물리학자들은 분산 컴퓨팅 시스템과 데이터의 고속 처리를 위한 FPGA 기술 등 IT 분야에서도 보통 상당한 전문성이 필요한 일들을 직접 해내는 경우가 많다.

컴퓨터 과학 및 공학 분야에서 한 분야의 전문가가 되기 쉽지 않은 일인데, LHC 실험 물리학자들은 어떻게 해서 이렇게 다양한 기술과 역량을 갖추고 일하게 되는 것일까? LHC 물리학자들이 이렇게 다양한 기술을 직접 익히면서까지 입자 물리학 연구에 매진하게 하는 그 동력은 과연 무엇일까? 이런 질문에 대한 답을 조금이라도 찾을 수 있다면 빅데이터 비즈니스를 수행하는 기업들이 데이터과학자들을 어떻게 일할 수 있도록 해야 비즈니스 성과를 낼 수 있는지에 대한 단서를 조금이라도 찾을 수 있을 것이다. 우선 데이터과학자로서 LHC 물리학자들의 일반적인 특성이 어떤지 같이 한번 살펴보도록 하자.

첫번째로, 다소 좀 진부한 얘기일 수도 있겠지만, LHC 물리학자들은 아직 밝혀지지 않은 지식에 대한 호기심과 탐구열, 그리고 해결되지 않은 과학적 난제를 풀려는 강한 의지를 가진 사람들이다. 무엇보다도 이런 특성이 LHC 실험 및 연구에 헌신하게 하는 동력이라고 볼 수 있다.

아래에 좀더 자세히 설명하겠지만, 물론 이러한 호기심과 탐구열, 문제 해결에 대한 의지만이 이들 LHC 물리학자들의 순수한 동기만은 아니다. 많은 사람의 참여와 막대한 사회적 자원을 들여야 연구할 수 있는 입자 물리학 분야는 과학의 여러 분야 중에서도 유난히 정치적인 분야이기도 하다. 입자물리학의 이런 특성 때문에 과학의 여러 분야중에서도 유난히 정치사회학적인 역동성이 많이 나타나서 많은 사회과학자의 연구 대상이기도 하다. 이런 현실을 감안하더라도, LHC 실험을 포함한 실험 입자 물리학 분야에서 일하는 대부분 물리학자는 지구상의 어떤 사람들보다도 호기심과 새로운 지식에 대한 열망과 탐구열, 과학적 문제 해결에 대한 의지가 강한 사람들이라고 단언할 수 있다.

LHC 실험 장치의 모든 것들은 바로 힉스 입자 발견을 비롯한 입자 물리학 현상을 검증하고 표준 모형과 다양한 입자 물리학 이론들이 예견하는 가설들을 검증하기 위해 디자인되고 만들어졌다. 그렇게 엄청난 양의 예산과 자원이 들어간 복잡한 장치가 인류의 우주의 근본 법칙에 대한 호기심, 알고 싶은 욕망을 위해 지어졌다는 것이 믿어지는가? 과거 LHC와 같이 경쟁할 것으로 예상되었던 미국의 초전도 수퍼 가속기(Superconducting Super Collider; SSC)가 미 의회의 결정으로 건설이 중단된 것도 한 과학분야의 지식 탐구를 위해 국민이 낸 세금을 그렇게 많이 쓰는 것에 대해 미국민의 공감이 부족했기 때문이다. 하지만, 물리학자들의 자연 현상에 대한 호기심과 문제 해결에 대한 열정이 결국 LHC라는 전무후무한 기계를 만들어내게 하였다.

두번째로, LHC 실험 물리학자들은 과학자이기도 하지만, 가속기의 여러 구성요소 중 자신이 전공하고 맡은 부분에 대해 전문가인 공학자이기도 하다. 이 얘기는 LHC 실험 물리학자들은 자신의 본 전문 분야인 입자 물리학에 대한 도메인 지식도 전문적으로 갖추고 있지만, 자신이 풀고자 하는 입자 물리학 문제를 풀기에 필요한 전문 기술과 설계 역량을 갖춘 공학자이기도 하다는 뜻이다.

LHC 실험 물리학자들이 쓰는 논문중 상당수가 공학 저널에 게재된다. 미국전기전자공학회에서 발간하는 핵과학 저널(IEEE Transactions on Nuclear Science)과 병렬, 분산 시스템 회보(IEEE Transactions on Parallel and Distributed Systems)와 같은 대표적인 공학 저널에 상당수 실릴 뿐만 아니라, LHC 관련해서 열리는 컨퍼런스 논문집이 공학 분야 저널의 특별호(Special Issue)로 발간되는 경우도 많다.

많은 LHC 실험 물리학자들은 수많은 노벨상 수상자를 배출하고, 역사적으로 유명한 대부분 과학자가 연구했던 분야가 실험 입자물리학인 것에 대해 큰 자부심을 가지고 일하고 있다. 그렇지만 이들 LHC 물리학자들은 자신이 실험 입자 물리학자라고 해서 다른 과학, 공학 분야의 지식을 배우고 자신의 연구에 활용하는데 주저함이 없다. 도메인 전문가로서의 LHC 실험 물리학자들은 자신이 직면한 물리학적 문제를 동료 연구자들과 같이 풀기 위해 필요한 공학과 기술을 배우는 데 적극적이다. 자신만의 영역을 특정한 분야로 한정하고 안주한다기보다는 매우 문제 해결 지향적으로 일한다고 볼 수 있다.

세번째로, LHC 물리학자들은 과학적 사고방식과 문제 해결에 대한 전문적인 훈련을 받은 사람들이다. 다시 얘기하면, 이들은 과학적인 사고방식으로 사물과 세계를 보는 것이 몸에 밴 사람들이라는 것이고, 과학적 지식을 추구하는데 필요한 문제 해결 방법과 전문 지식을 체계적으로 훈련 받은 사람들이다.

LHC 물리학자들은 실험 물리학자로서 자신의 경력을 키우기 위해 다양한 훈련을 받게 된다. 무엇보다도 실험하면서 실험 데이터를 기반으로 데이터 너머에서 일어나는 현상의 본질에 대해 체계적이고 깊이 있게 생각하고, 이런 추론을 기반으로 사물과 대상을 지배하는 법칙에 대해 생각하는 귀납적인 사고방식에 대해 체계적인 훈련을 받게 된다. 이에 더해서, 이론 물리학자들과 수학자들이 실험 사실들을 추상화해서 정식화한 물리학 방정식과 수학적 공식들을 이용해 자신의 실험 결과를 설명하는 이론을 만들거나 해석하고, 그 의미에 대한 결론을 도출하고 새로운 결과를 예측하는 연역적 사고 방법도 체계적으로 훈련하게 된다.

또한 데이터 분석을 위한 수학, 통계학에도 체계적인 훈련을 받게 되며, 이들 수학, 통계학적 지식을 이용한 데이터 처리 및 분석을 위해 컴퓨터 기술과 과학에 대해서도 꽤 깊은 소양을 가지게 된다. 이런 과정을 통해 LHC 물리학자들은 단순히 입자 물리학 분야의 지식만을 축적한 전문가들만이 아니라, 귀납적, 연역적 사고방식으로 문제를 해결하는데 익숙한, 과학적 문제 해결 역량을 전문적으로 갖춘 문제 해결 전문가이기도 한 것이다.

이렇게 귀납적, 연역적 사고방식과 데이터 기반의 문제 해결 능력을 갖춘 물리학자들 상당수가 최근 데이터 과학자로 전업해서 활동하고 있다. 사실, 데이터 과학자에게 요구되는 역량의 상당 부분이 실험 물리학자들이 이미 자신의 연구 분야에서 경력을 쌓으면서 받게 되는 훈련을 통해 얻게 되는 역량들이다. 이런 의미에서, LHC 실험 물리학자들이 경력을 쌓아가면서 쌓게 되는 소양이 데이터 과학자로서 어떤 역량을 갖추어야 하는지에 대한 힌트를 주기도 한다.

이런 특성을 가진 LHC 실험 물리학자들은 그렇다면 왜 LHC 빅데이터 분석을 추구하는지에 대해 같이 생각해보자. LHC 실험 물리학자들이 자신의 연구 분야에 몰두하게 하는 근본적인 동기가 무엇인지 같이 생각해보면 데이터 과학자 조직을 이끄는 리더들이 자신의 데이터 과학자들을 어떻게 동기 부여를 해야 할지 힌트를 얻을 수 있을 것이다.

첫번째로, 역시 다소 진부한 얘기겠지만, LHC 실험 물리학자들이 우주와 물질을 지배하는 원리를 발견하고 직접 확인하고 싶어 하는 앎에 대한 욕구이다. 무엇보다도 연구하는 대상인 입자물리학적 현상에 대한 지식과 통찰, 이해에 대한 욕구가 LHC 실험 물리학자들의 호기심을 자극하는 가장 큰 동기라고 할 수 있다. LHC 물리학자들의 호기심과 지적인 욕구에 대해서는 앞에서 어느 정도 살펴보았으니 여기서는 간단하게 언급하기로 한다.

두번째로, 경쟁이 치열한 입자물리학계에서 실험 입자 물리학자로서 경력을 지켜 가기 위해서는 포스트 닥터 과정까지 좋은 연구 실적을 내야만 한다. 이렇게 실험 입자 물리학자로서 경력을 지켜가면서 자신의 연구를 지속할 수 있는 좋은 직장을 구하고, 연구비를 지속해서 지원받기 위해서 치열하게 연구하며, LHC와 같은 국제 공동 연구에서 좋은 기여를 통해 동료와 선배 물리학자들 눈에 들기 위해 노력하는 현실적인 이유를 무시할 수 없다.

전통적으로 많은 노벨상을 배출한 입자물리학계는 다양한 물리학 세부 분야중에서도 그만큼 가장 뛰어난 천재, 수재들만이 몰려드는 분야이기도 하다. 이렇게 경쟁이 치열한 분야에서 안정적으로 연구를 지속할 수 있는 직장을 잡고 연구비를 지속해서 지원받기 위해서는 치열한 노력이 필요하다.

요즘은 예전보다는 한풀 꺾인 분위기이기는 하지만, 그래도 여전히 많은 물리학 전공의 과학자들이 LHC와 같이 커뮤니티가 잘 구성된 국제 공동 연구 프로젝트에서 고에너지 입자 물리학을 전공하려고 한다. 이렇게 LHC와 같이 국제 공동 연구로 잘 자리 잡은 프로젝트에서 일할 수 있어야 자신의 직장과 연구비가 안전하게 보장되기 때문에 LHC 실험에 공식적으로 참여하고 CERN 회원국 정부로부터 공식적인 지원을 받는 연구팀의 일원으로 직장을 잡기 위해서는 치열하게 노력하고 동료, 선배 연구자들에게 자신과 자신의 연구 가치를 인정받기 위해 노력해야 한다.

전 세계적으로 LHC 실험에 참여하는 연구팀이 많다고 하더라도, 매년 배출되는 신진 물리학자들을 모두 받아주기에는 LHC 실험을 위한 정부의 연구비와 연구팀의 자리가 매우 제한적이다. 아무리 최첨단 기술을 개발하고 활용하는 LHC 실험이고, LHC 실험을 통해 개발된 기술들이 상용화 가치가 높은 기술들이 많다고 하더라도 그 기술들 모두가 언제 어떻게 상용화될 수 있을지는 알지 못하기 때문에 각국 정부가 무한정 많은 재원을 투입하도록 사회적인 합의를 이루기에는 어려운 점이 많다.

이렇게 LHC 실험의 규모와 복잡성에 비해 자원과 재원이 제한적인 현실에서 자신의 경력을 지켜가면서 연구비를 지속해서 지원받을 수 있으려면 연구에 치열하게 몰두하여 좋은 연구성과를 낼 수밖에 없다.

이렇게 치열하게 노력을 하더라도 연구를 지속해서 할 수 있는 세계 유수의 고에너지 물리학 전문 연구소에 자리를 잡기 위해서는 운도 많이 따라야 하며, 좋은 직장에 자리를 잡을 만큼의 좋은 연구 성과를 얻는 것도 개인의 노력과는 무관한, 그야말로 신의 도움이라고밖에 표현할 길이 없는 우연의 영향을 받는 경우가 많다. 그렇다고는 해도 기본적으로 이런 운이 따라주기 위해서라도 자기 자신을 지속해서 단련하고 꾸준히 양질의 연구성과를 내면서 준비되어 있어야 이런 운도 낚아챌 수 있는 것이 입자물리학계의 현실이라, 기본적으로 입자물리학자들은 열심히 연구에 몰입할 수밖에 없다.

세번째로, LHC 물리학자들이 본인의 경력을 지키기 위한 현실적인 이슈와 함께, LHC 실험이 매우 많은 동료, 선배 연구자들과 협업이 필요한 거대 과학 실험이라는 것이 많은 노력과 시간을 들여 연구와 데이터 분석에 몰두하는 이유이다.

거대 과학 실험은 한번의 데이터를 얻기 위해서도 고가의 실험 장비를 많은 사람이 협업해야 하며, 이런 이유로 실험을 준비하고 실행하는데 많은 비용과 시간이 필요하다. 실험을 계획하고 준비하는 과정에서 사소한 실수가 있거나 준비가 부족하면 애써 얻은 실험 데이터가 무용지물이 되거나 의미가 없는 데이터를 얻게 되는 경우도 많다. 개인적으로 혼자 열심히 노력한다고 해서 그 결과물을 노력에 비례한 만큼 빨리, 많이 얻을 수 있는 것이 아니라 선배, 동료 연구자들과 의사소통을 긴밀히 하면서 실험 커뮤니티에서의 자신의 역할과 주변 공동 연구자들과 팀워크를 적절하게 지켜야만 의미 있는 실험 데이터를 얻을 수 있다.

이렇게 많은 연구자와 공동으로 실험을 진행하는 경우 실험 그 자체보다 선배, 동료 연구자들과 커뮤니케이션과 협업을 위한 일에 더 많이 시간과 노력을 들여야 하는 경우가 많다. 이런 과정이 자신이 원래 관심 있게 추구하는 문제와 관련이 없어 보일지라도 인내심을 가지고 꾸준하게 밀고 나가야만 좋은 연구성과를 얻을 수 있는 실험 데이터를 얻을 수 있다. 이런 이유로 기본적으로 자신의 연구를 위해 최선을 다하기도 해야 하지만, 선배, 동료 연구자들과 협업을 위한 일도 완수해가면서 자신의 연구를 지속하기 위해서는 정말 열심히, 성실하고 꾸준하게 일해야만 경쟁이 치열한 LHC 실험 커뮤니티에서 의미 있는 연구 성과를 낼 수 있다.

LHC 실험 데이터 분석에서 연구자 자신이 뭔가 의미 있는 실험 결과를 발견했다고 하더라도 본인이 바로 연구 결과를 발표할 수 없는 경우가 많다. 대개 커뮤니티의 공동 연구자들과 연구팀들에 의해서 그 결과에 대한 평가와 검증이 이루어지게 되며, 이렇게 실험 결과에 대한 평가와 검증을 하는 과정도 많은 시간과 노력이 필요한 경우가 많다. 이런 이유로 효과적인 커뮤니케이션 기술과 대인관계가 실험 입자물리학 분야에서 매우 중요하며, 이렇게 본인의 노력만으로 해결이 어려운 일들이 연구 과정에서 많이 일어나기 때문에 기본적으로 많은 노력으로 준비되어 있지 않으면 실험 입자 물리학자로서 경력을 지켜나가기가 쉽지가 않은 것이다.

앞에서 살펴보았듯이, LHC 실험에서의 데이터과학자에 해당하는 LHC 물리학자들은 독립적인 과학자로서 많은 노력을 기울여야 하지만, LHC 실험 커뮤니티 내에서 각자가 맡은 역할에도 충실해야 본인의 경력도 키워 나갈 수 있고, LHC 실험도 문제없이 진행될 수 있다. 다른 과학 분야에 비해 LHC 실험과 같은 거대 과학의 경우 그 실험의 복잡성 때문에 유난히 팀워크와 커뮤니케이션 역량이 강조되는 경우가 많다. 
 
그림 1. 데이터과학자로서 LHC 물리학자들은 과학적 문제 해결 방식과 문제 해결을 위한 다양한 공학적 방법론과 소프트웨어 기술들을 전문적으로 훈련 받고 역량을 쌓아온 사람들이다.
(그림 출처:
(위 왼쪽) https://www.royalholloway.ac.uk/physics/research/postgraduateopportunities/particlephysics/index.aspx
(위 오른쪽) https://www.ua.edu/news/2013/09/particle-physics-post-higgs/
(아래 왼쪽) http://www.damtp.cam.ac.uk/research/hep/about/
(아래중간) https://public.web.cern.ch/public/features-archive/1204-1206.html
(아래 오른쪽) http://cms.web.cern.ch/news/cms-releases-first-batch-high-level-lhc-open-data )


지금까지 살펴본 LHC 물리학자들의 특성과 자질들, 그리고 그들만의 동기 부여 방식과 독창적이고 고유한 연구 성과만을 인정하는 입자물리학계의 전통과 분위기로 인해 LHC 물리학자들은 데이터과학자로서 갖추어야 할 역량과 성품, 자질을 자연스럽게 갖추게 된다. 이렇게 자연스럽게 데이터과학자로서 갖추어야 할 역량과 성품, 자질을 갖추게 되는 LHC 물리학자들이 최근 IT 업계의 데이터과학자나 소프트웨어 엔지니어로 진출하는 경우도 많아졌다. 필자도 LHC 물리학을 연구하다가 데이터과학자 및 소프트웨어 엔지니어로 경력을 전환한 경우이고, LHC 실험에서 같이 일하던 필자의 동료들도 유럽과 북미의 주요 IT기업과 빅데이터 관련 기업으로 이직하는 경우를 자주 보았다.
 


데이터과학자로서 LHC 물리학자들은 데이터과학자들이 어떤 역량을 쌓고 어떻게 일해야 하는지에 대해 좋은 역할 모델이 되고 있다. 데이터과학자로서 경력을 설계하고 싶은 IT전문가들은 LHC 물리학자들과 같은 거대 과학을 연구하는 실험 과학자들이 어떤 역량을 쌓고 훈련을 받는지 살펴보면 자신의 경력을 어떻게 키워갈 수 있을지 아이디어를 얻을 수 있을 것이다. 

 




2018.12.28

김진철의 How-to-Big Data | 빅데이터 조직과 시스템 (3)

김진철 | CIO KR
LHC 실험을 수행하는 물리학자들과 연구자들의 특성
지금까지 LHC 실험을 위한 만든 LHC 가속기와 네 개의 검출기, 그리고 데이터 가공 및 분석을 위한 LHC 데이터 처리 시스템과 WLCG 그리드 컴퓨팅 기술을 소개하면서 빅데이터 기술의 모든 요소를 갖추고 있는 LHC 프로젝트의 면면을 살펴보았다. LHC 빅데이터 인프라의 모든 것이 중요하고, 어느 하나라도 제대로 동작하지 않으면 LHC에서 생산되는 수백 페타바이트의 빅데이터를 제대로 처리하기는 불가능하다고 얘기했다. LHC 빅데이터 인프라의 모든 것이 다 중요하지만, 무엇보다도 중요한 것은 이런 LHC 빅데이터 인프라를 만들어낸 사람들, 그리고 이런 LHC 빅데이터 인프라를 이용해 우주와 물질을 지배하는 근본 법칙과 통찰을 만들어내는 사람들, 즉 LHC 연구자들이다.

LHC 연구자들이 그들의 창의성과 역량을 헌신적으로 발휘하지 않았더라면 LHC 실험 장치와 빅데이터 인프라는 존재하지 못했을 것이고, LHC 실험장치에서 생산된 데이터를 이용해 힉스 입자가 존재하는지 여부도 확인하지 못했을 것이다. LHC 프로젝트의 꽃은 다른 어떤 요소보다도 바로 LHC 실험을 위해 일하는 과학자들일 것이다. 오늘은 LHC 실험을 위해 일하는 과학자들의 특성을 같이 살펴보면서, 빅데이터를 활용하는 데이터과학자들이 어떤 사람들이고 어떤 특성을 가진 사람들인지, 이들을 어떻게 일할 수 있도록 해야 빅데이터 비즈니스를 수행하는 조직이 성과를 낼 수 있을 것인지 같이 고민해보도록 하자.

LHC 과학자들은 다양한 분야의 전문가들로 구성되어 있지만, 가장 많은 비중을 차지하고 있는 사람들은 LHC 실험장치를 이용해 실험 입자 물리학을 연구하려는 물리학자들이다. 이들 LHC 물리학자들이 쉽게 말하자면 데이터과학자들이라고 볼 수 있다. 사람마다 편차가 많고, LHC 장치의 복잡성 때문에 물리학자들이 모든 영역의 기술개발을 하지는 못하지만, 그래도 LHC 실험 장치의 디자인부터 개발, 데이터 분석까지 대부분 영역에서 영향력을 발휘하고 실제로 연구를 수행하는 사람들은 LHC 실험 물리학자들이다.

LHC 물리학자들은 그 자신이 입자 물리학과 입자 물리 현상학의 전문가, 즉 도메인 전문가이기도 하지만, 자신이 관심을 가지고 연구하는 문제를 풀기 위해 필요한 기술과 공학분야에도 정통한 사람들이 많다. 기본적으로 과학기술 계산(scientific computing)과 데이터 분석을 위한 소프트웨어 개발 및 프로그래밍 소양은 갖추고 있고, 그리드 컴퓨팅, 웹 기술 기반 분산 시스템 개발 등의 IT 기술에도 상당한 실력을 갖추고 있는 경우가 많다. 검출기 시스템을 개발하는 LHC 물리학자들은 분산 컴퓨팅 시스템과 데이터의 고속 처리를 위한 FPGA 기술 등 IT 분야에서도 보통 상당한 전문성이 필요한 일들을 직접 해내는 경우가 많다.

컴퓨터 과학 및 공학 분야에서 한 분야의 전문가가 되기 쉽지 않은 일인데, LHC 실험 물리학자들은 어떻게 해서 이렇게 다양한 기술과 역량을 갖추고 일하게 되는 것일까? LHC 물리학자들이 이렇게 다양한 기술을 직접 익히면서까지 입자 물리학 연구에 매진하게 하는 그 동력은 과연 무엇일까? 이런 질문에 대한 답을 조금이라도 찾을 수 있다면 빅데이터 비즈니스를 수행하는 기업들이 데이터과학자들을 어떻게 일할 수 있도록 해야 비즈니스 성과를 낼 수 있는지에 대한 단서를 조금이라도 찾을 수 있을 것이다. 우선 데이터과학자로서 LHC 물리학자들의 일반적인 특성이 어떤지 같이 한번 살펴보도록 하자.

첫번째로, 다소 좀 진부한 얘기일 수도 있겠지만, LHC 물리학자들은 아직 밝혀지지 않은 지식에 대한 호기심과 탐구열, 그리고 해결되지 않은 과학적 난제를 풀려는 강한 의지를 가진 사람들이다. 무엇보다도 이런 특성이 LHC 실험 및 연구에 헌신하게 하는 동력이라고 볼 수 있다.

아래에 좀더 자세히 설명하겠지만, 물론 이러한 호기심과 탐구열, 문제 해결에 대한 의지만이 이들 LHC 물리학자들의 순수한 동기만은 아니다. 많은 사람의 참여와 막대한 사회적 자원을 들여야 연구할 수 있는 입자 물리학 분야는 과학의 여러 분야 중에서도 유난히 정치적인 분야이기도 하다. 입자물리학의 이런 특성 때문에 과학의 여러 분야중에서도 유난히 정치사회학적인 역동성이 많이 나타나서 많은 사회과학자의 연구 대상이기도 하다. 이런 현실을 감안하더라도, LHC 실험을 포함한 실험 입자 물리학 분야에서 일하는 대부분 물리학자는 지구상의 어떤 사람들보다도 호기심과 새로운 지식에 대한 열망과 탐구열, 과학적 문제 해결에 대한 의지가 강한 사람들이라고 단언할 수 있다.

LHC 실험 장치의 모든 것들은 바로 힉스 입자 발견을 비롯한 입자 물리학 현상을 검증하고 표준 모형과 다양한 입자 물리학 이론들이 예견하는 가설들을 검증하기 위해 디자인되고 만들어졌다. 그렇게 엄청난 양의 예산과 자원이 들어간 복잡한 장치가 인류의 우주의 근본 법칙에 대한 호기심, 알고 싶은 욕망을 위해 지어졌다는 것이 믿어지는가? 과거 LHC와 같이 경쟁할 것으로 예상되었던 미국의 초전도 수퍼 가속기(Superconducting Super Collider; SSC)가 미 의회의 결정으로 건설이 중단된 것도 한 과학분야의 지식 탐구를 위해 국민이 낸 세금을 그렇게 많이 쓰는 것에 대해 미국민의 공감이 부족했기 때문이다. 하지만, 물리학자들의 자연 현상에 대한 호기심과 문제 해결에 대한 열정이 결국 LHC라는 전무후무한 기계를 만들어내게 하였다.

두번째로, LHC 실험 물리학자들은 과학자이기도 하지만, 가속기의 여러 구성요소 중 자신이 전공하고 맡은 부분에 대해 전문가인 공학자이기도 하다. 이 얘기는 LHC 실험 물리학자들은 자신의 본 전문 분야인 입자 물리학에 대한 도메인 지식도 전문적으로 갖추고 있지만, 자신이 풀고자 하는 입자 물리학 문제를 풀기에 필요한 전문 기술과 설계 역량을 갖춘 공학자이기도 하다는 뜻이다.

LHC 실험 물리학자들이 쓰는 논문중 상당수가 공학 저널에 게재된다. 미국전기전자공학회에서 발간하는 핵과학 저널(IEEE Transactions on Nuclear Science)과 병렬, 분산 시스템 회보(IEEE Transactions on Parallel and Distributed Systems)와 같은 대표적인 공학 저널에 상당수 실릴 뿐만 아니라, LHC 관련해서 열리는 컨퍼런스 논문집이 공학 분야 저널의 특별호(Special Issue)로 발간되는 경우도 많다.

많은 LHC 실험 물리학자들은 수많은 노벨상 수상자를 배출하고, 역사적으로 유명한 대부분 과학자가 연구했던 분야가 실험 입자물리학인 것에 대해 큰 자부심을 가지고 일하고 있다. 그렇지만 이들 LHC 물리학자들은 자신이 실험 입자 물리학자라고 해서 다른 과학, 공학 분야의 지식을 배우고 자신의 연구에 활용하는데 주저함이 없다. 도메인 전문가로서의 LHC 실험 물리학자들은 자신이 직면한 물리학적 문제를 동료 연구자들과 같이 풀기 위해 필요한 공학과 기술을 배우는 데 적극적이다. 자신만의 영역을 특정한 분야로 한정하고 안주한다기보다는 매우 문제 해결 지향적으로 일한다고 볼 수 있다.

세번째로, LHC 물리학자들은 과학적 사고방식과 문제 해결에 대한 전문적인 훈련을 받은 사람들이다. 다시 얘기하면, 이들은 과학적인 사고방식으로 사물과 세계를 보는 것이 몸에 밴 사람들이라는 것이고, 과학적 지식을 추구하는데 필요한 문제 해결 방법과 전문 지식을 체계적으로 훈련 받은 사람들이다.

LHC 물리학자들은 실험 물리학자로서 자신의 경력을 키우기 위해 다양한 훈련을 받게 된다. 무엇보다도 실험하면서 실험 데이터를 기반으로 데이터 너머에서 일어나는 현상의 본질에 대해 체계적이고 깊이 있게 생각하고, 이런 추론을 기반으로 사물과 대상을 지배하는 법칙에 대해 생각하는 귀납적인 사고방식에 대해 체계적인 훈련을 받게 된다. 이에 더해서, 이론 물리학자들과 수학자들이 실험 사실들을 추상화해서 정식화한 물리학 방정식과 수학적 공식들을 이용해 자신의 실험 결과를 설명하는 이론을 만들거나 해석하고, 그 의미에 대한 결론을 도출하고 새로운 결과를 예측하는 연역적 사고 방법도 체계적으로 훈련하게 된다.

또한 데이터 분석을 위한 수학, 통계학에도 체계적인 훈련을 받게 되며, 이들 수학, 통계학적 지식을 이용한 데이터 처리 및 분석을 위해 컴퓨터 기술과 과학에 대해서도 꽤 깊은 소양을 가지게 된다. 이런 과정을 통해 LHC 물리학자들은 단순히 입자 물리학 분야의 지식만을 축적한 전문가들만이 아니라, 귀납적, 연역적 사고방식으로 문제를 해결하는데 익숙한, 과학적 문제 해결 역량을 전문적으로 갖춘 문제 해결 전문가이기도 한 것이다.

이렇게 귀납적, 연역적 사고방식과 데이터 기반의 문제 해결 능력을 갖춘 물리학자들 상당수가 최근 데이터 과학자로 전업해서 활동하고 있다. 사실, 데이터 과학자에게 요구되는 역량의 상당 부분이 실험 물리학자들이 이미 자신의 연구 분야에서 경력을 쌓으면서 받게 되는 훈련을 통해 얻게 되는 역량들이다. 이런 의미에서, LHC 실험 물리학자들이 경력을 쌓아가면서 쌓게 되는 소양이 데이터 과학자로서 어떤 역량을 갖추어야 하는지에 대한 힌트를 주기도 한다.

이런 특성을 가진 LHC 실험 물리학자들은 그렇다면 왜 LHC 빅데이터 분석을 추구하는지에 대해 같이 생각해보자. LHC 실험 물리학자들이 자신의 연구 분야에 몰두하게 하는 근본적인 동기가 무엇인지 같이 생각해보면 데이터 과학자 조직을 이끄는 리더들이 자신의 데이터 과학자들을 어떻게 동기 부여를 해야 할지 힌트를 얻을 수 있을 것이다.

첫번째로, 역시 다소 진부한 얘기겠지만, LHC 실험 물리학자들이 우주와 물질을 지배하는 원리를 발견하고 직접 확인하고 싶어 하는 앎에 대한 욕구이다. 무엇보다도 연구하는 대상인 입자물리학적 현상에 대한 지식과 통찰, 이해에 대한 욕구가 LHC 실험 물리학자들의 호기심을 자극하는 가장 큰 동기라고 할 수 있다. LHC 물리학자들의 호기심과 지적인 욕구에 대해서는 앞에서 어느 정도 살펴보았으니 여기서는 간단하게 언급하기로 한다.

두번째로, 경쟁이 치열한 입자물리학계에서 실험 입자 물리학자로서 경력을 지켜 가기 위해서는 포스트 닥터 과정까지 좋은 연구 실적을 내야만 한다. 이렇게 실험 입자 물리학자로서 경력을 지켜가면서 자신의 연구를 지속할 수 있는 좋은 직장을 구하고, 연구비를 지속해서 지원받기 위해서 치열하게 연구하며, LHC와 같은 국제 공동 연구에서 좋은 기여를 통해 동료와 선배 물리학자들 눈에 들기 위해 노력하는 현실적인 이유를 무시할 수 없다.

전통적으로 많은 노벨상을 배출한 입자물리학계는 다양한 물리학 세부 분야중에서도 그만큼 가장 뛰어난 천재, 수재들만이 몰려드는 분야이기도 하다. 이렇게 경쟁이 치열한 분야에서 안정적으로 연구를 지속할 수 있는 직장을 잡고 연구비를 지속해서 지원받기 위해서는 치열한 노력이 필요하다.

요즘은 예전보다는 한풀 꺾인 분위기이기는 하지만, 그래도 여전히 많은 물리학 전공의 과학자들이 LHC와 같이 커뮤니티가 잘 구성된 국제 공동 연구 프로젝트에서 고에너지 입자 물리학을 전공하려고 한다. 이렇게 LHC와 같이 국제 공동 연구로 잘 자리 잡은 프로젝트에서 일할 수 있어야 자신의 직장과 연구비가 안전하게 보장되기 때문에 LHC 실험에 공식적으로 참여하고 CERN 회원국 정부로부터 공식적인 지원을 받는 연구팀의 일원으로 직장을 잡기 위해서는 치열하게 노력하고 동료, 선배 연구자들에게 자신과 자신의 연구 가치를 인정받기 위해 노력해야 한다.

전 세계적으로 LHC 실험에 참여하는 연구팀이 많다고 하더라도, 매년 배출되는 신진 물리학자들을 모두 받아주기에는 LHC 실험을 위한 정부의 연구비와 연구팀의 자리가 매우 제한적이다. 아무리 최첨단 기술을 개발하고 활용하는 LHC 실험이고, LHC 실험을 통해 개발된 기술들이 상용화 가치가 높은 기술들이 많다고 하더라도 그 기술들 모두가 언제 어떻게 상용화될 수 있을지는 알지 못하기 때문에 각국 정부가 무한정 많은 재원을 투입하도록 사회적인 합의를 이루기에는 어려운 점이 많다.

이렇게 LHC 실험의 규모와 복잡성에 비해 자원과 재원이 제한적인 현실에서 자신의 경력을 지켜가면서 연구비를 지속해서 지원받을 수 있으려면 연구에 치열하게 몰두하여 좋은 연구성과를 낼 수밖에 없다.

이렇게 치열하게 노력을 하더라도 연구를 지속해서 할 수 있는 세계 유수의 고에너지 물리학 전문 연구소에 자리를 잡기 위해서는 운도 많이 따라야 하며, 좋은 직장에 자리를 잡을 만큼의 좋은 연구 성과를 얻는 것도 개인의 노력과는 무관한, 그야말로 신의 도움이라고밖에 표현할 길이 없는 우연의 영향을 받는 경우가 많다. 그렇다고는 해도 기본적으로 이런 운이 따라주기 위해서라도 자기 자신을 지속해서 단련하고 꾸준히 양질의 연구성과를 내면서 준비되어 있어야 이런 운도 낚아챌 수 있는 것이 입자물리학계의 현실이라, 기본적으로 입자물리학자들은 열심히 연구에 몰입할 수밖에 없다.

세번째로, LHC 물리학자들이 본인의 경력을 지키기 위한 현실적인 이슈와 함께, LHC 실험이 매우 많은 동료, 선배 연구자들과 협업이 필요한 거대 과학 실험이라는 것이 많은 노력과 시간을 들여 연구와 데이터 분석에 몰두하는 이유이다.

거대 과학 실험은 한번의 데이터를 얻기 위해서도 고가의 실험 장비를 많은 사람이 협업해야 하며, 이런 이유로 실험을 준비하고 실행하는데 많은 비용과 시간이 필요하다. 실험을 계획하고 준비하는 과정에서 사소한 실수가 있거나 준비가 부족하면 애써 얻은 실험 데이터가 무용지물이 되거나 의미가 없는 데이터를 얻게 되는 경우도 많다. 개인적으로 혼자 열심히 노력한다고 해서 그 결과물을 노력에 비례한 만큼 빨리, 많이 얻을 수 있는 것이 아니라 선배, 동료 연구자들과 의사소통을 긴밀히 하면서 실험 커뮤니티에서의 자신의 역할과 주변 공동 연구자들과 팀워크를 적절하게 지켜야만 의미 있는 실험 데이터를 얻을 수 있다.

이렇게 많은 연구자와 공동으로 실험을 진행하는 경우 실험 그 자체보다 선배, 동료 연구자들과 커뮤니케이션과 협업을 위한 일에 더 많이 시간과 노력을 들여야 하는 경우가 많다. 이런 과정이 자신이 원래 관심 있게 추구하는 문제와 관련이 없어 보일지라도 인내심을 가지고 꾸준하게 밀고 나가야만 좋은 연구성과를 얻을 수 있는 실험 데이터를 얻을 수 있다. 이런 이유로 기본적으로 자신의 연구를 위해 최선을 다하기도 해야 하지만, 선배, 동료 연구자들과 협업을 위한 일도 완수해가면서 자신의 연구를 지속하기 위해서는 정말 열심히, 성실하고 꾸준하게 일해야만 경쟁이 치열한 LHC 실험 커뮤니티에서 의미 있는 연구 성과를 낼 수 있다.

LHC 실험 데이터 분석에서 연구자 자신이 뭔가 의미 있는 실험 결과를 발견했다고 하더라도 본인이 바로 연구 결과를 발표할 수 없는 경우가 많다. 대개 커뮤니티의 공동 연구자들과 연구팀들에 의해서 그 결과에 대한 평가와 검증이 이루어지게 되며, 이렇게 실험 결과에 대한 평가와 검증을 하는 과정도 많은 시간과 노력이 필요한 경우가 많다. 이런 이유로 효과적인 커뮤니케이션 기술과 대인관계가 실험 입자물리학 분야에서 매우 중요하며, 이렇게 본인의 노력만으로 해결이 어려운 일들이 연구 과정에서 많이 일어나기 때문에 기본적으로 많은 노력으로 준비되어 있지 않으면 실험 입자 물리학자로서 경력을 지켜나가기가 쉽지가 않은 것이다.

앞에서 살펴보았듯이, LHC 실험에서의 데이터과학자에 해당하는 LHC 물리학자들은 독립적인 과학자로서 많은 노력을 기울여야 하지만, LHC 실험 커뮤니티 내에서 각자가 맡은 역할에도 충실해야 본인의 경력도 키워 나갈 수 있고, LHC 실험도 문제없이 진행될 수 있다. 다른 과학 분야에 비해 LHC 실험과 같은 거대 과학의 경우 그 실험의 복잡성 때문에 유난히 팀워크와 커뮤니케이션 역량이 강조되는 경우가 많다. 
 
그림 1. 데이터과학자로서 LHC 물리학자들은 과학적 문제 해결 방식과 문제 해결을 위한 다양한 공학적 방법론과 소프트웨어 기술들을 전문적으로 훈련 받고 역량을 쌓아온 사람들이다.
(그림 출처:
(위 왼쪽) https://www.royalholloway.ac.uk/physics/research/postgraduateopportunities/particlephysics/index.aspx
(위 오른쪽) https://www.ua.edu/news/2013/09/particle-physics-post-higgs/
(아래 왼쪽) http://www.damtp.cam.ac.uk/research/hep/about/
(아래중간) https://public.web.cern.ch/public/features-archive/1204-1206.html
(아래 오른쪽) http://cms.web.cern.ch/news/cms-releases-first-batch-high-level-lhc-open-data )


지금까지 살펴본 LHC 물리학자들의 특성과 자질들, 그리고 그들만의 동기 부여 방식과 독창적이고 고유한 연구 성과만을 인정하는 입자물리학계의 전통과 분위기로 인해 LHC 물리학자들은 데이터과학자로서 갖추어야 할 역량과 성품, 자질을 자연스럽게 갖추게 된다. 이렇게 자연스럽게 데이터과학자로서 갖추어야 할 역량과 성품, 자질을 갖추게 되는 LHC 물리학자들이 최근 IT 업계의 데이터과학자나 소프트웨어 엔지니어로 진출하는 경우도 많아졌다. 필자도 LHC 물리학을 연구하다가 데이터과학자 및 소프트웨어 엔지니어로 경력을 전환한 경우이고, LHC 실험에서 같이 일하던 필자의 동료들도 유럽과 북미의 주요 IT기업과 빅데이터 관련 기업으로 이직하는 경우를 자주 보았다.
 


데이터과학자로서 LHC 물리학자들은 데이터과학자들이 어떤 역량을 쌓고 어떻게 일해야 하는지에 대해 좋은 역할 모델이 되고 있다. 데이터과학자로서 경력을 설계하고 싶은 IT전문가들은 LHC 물리학자들과 같은 거대 과학을 연구하는 실험 과학자들이 어떤 역량을 쌓고 훈련을 받는지 살펴보면 자신의 경력을 어떻게 키워갈 수 있을지 아이디어를 얻을 수 있을 것이다. 

 


X