2018.06.20

'45억 년 역사 담은 8천 만 표본을 디지털로' 영국 자연사박물관

Thomas Macaulay | CIO UK
영국 자연사박물관이 CIO인 데이비드 토마스의 진두지휘 아래 새로운 관람객 경험을 창출하고 과학 연구를 고도화하기 위해 엄청난 규모의 소장 표본을 디지털화하고 있다.



영국 자연사박물관의 CIO인 데이비드 토마스는 45억 년의 삶을 기록한 8,000만 개의 동식물 표본을 디지털화하는 프로젝트를 진행하고 있다.

지난 250년 동안 수집된 400만 개 이상의 표본은 이제 국립 역사박물관 데이터 포털(National History Museum Data Portal)에서 활용할 수 있다. 5년 이내에 2,000만 개의 표본을 디지털화하는 것이 목표다.

토마스는 <CIO UK>와의 인터뷰에서 "대부분 박물관은 소장품 규모가 매우 작다. 대다수가 전시되어 있다"고 말했다.

그는 “자연사박물관에는 800만 개의 표본이 있고 그중 3,000개가 전시되어 있다. 따라서 디지털화가 가능하다는 것은 대중에게도 환상적이고 과학적인 목적에서도 훌륭하다"고 강조했다.

연구원들은 지구의 지질학에서 시작해서 태양계까지 다양한 주제들의 과거, 현재, 미래를 밝히기 위해 박물관에 있는 자료를 연구한다.

표본 자료는 기후, 생물 다양성, 인류 건강을 포함한 100개 이상의 과학 논문에서 이미 인용되었다.

기존의 연구원들은 물리적인 재료만 활용할 수 있었다. 이제는 선조들의 특징을 모방해서 그들이 퇴화하기 전을 재현한 ‘디지털 트윈’에도 접근할 수 있다.

토마스는 "소장품들은 정말 중요하다"며 “나는 어제 체더인(cheddar man)에서 추출한 DNA와 체더인 사진을 재연하면서 얻어낸 고대 DNA 추출물을 이용해 토론에 참여했다. 모든 것이 디지털화와 데이터에서 온 것이다"고 말했다.

디지털화 과정
7만 667장에 이르는 기생충 슬라이드부터 548년 된 책에 이르기까지 다양한 개체가 촬영이나 스캔 작업을 통해 3D 이미지로 변환된다. 객체 인식 소프트웨어는 표본을 분석하여 유형별로 자동 분류한다.

박물관은 머신러닝과 텍스트 인식을 활용해 대규모 표본에서 데이터를 추출한 다음 이미지에 라벨을 지정하는 방법도 실험하고 있다.

"이것들은 종류를 막론하고 매우 민감한 객체들이다”고 토마스는 말했다. 이어서 "현미경 내부일 수도 있고 대왕고래일 수도 있다. 움직이고 다루기에는 크기와 등급이 매우 다양하기 때문에 현장에서의 디지털화는 우리에게 정말로 중요하다"고 전했다.

디지털화는 연구 시간과 비용을 절약할 수 있을 뿐만 아니라 새로운 분석 방법을 제공해준다. 실제로 한 연구팀은 100년 이상의 기온 기록을 분석해 나비 관련 데이터를 조사하는 방법을 찾았다.

그들의 비교 연구는 온난화로 인해 브리티시 버터플라이(British butterflies) 종의 나비가 일찍 출현했고 유충이 먹을 수 있는 식물이 아직 확보되지 않은 상황에서 생존 가능성이 줄어들었다는 걸 보여준다.

디지털 박물관
영국 전체 박물관의 방문자 수가 감소하고 있다. 자연사박물관에는 지난해 440만 명이 방문했는데 이는 2016년에 비해 12% 감소한 수치다.

‘디지털 박물관’의 개념은 개인화된 혁신적인 경험을 만들어서 수익원을 높이고 새로운 매출 흐름을 발굴할 수 있다는 것이다.

관람객들은 데이비드 아텐버러 경이 마련한 증강현실을 경험해 볼 수 있다. 가상으로 표본을 보거나 변경사항이 생길 때마다 관심사에 맞게 최적화된 모바일 콘텐츠를 받아볼 수도 있다.

자연사박물관은 시스코와 제휴해 위치 기반 서비스와 트래픽 분석, 박물관 레이아웃 조정에 대한 실시간 분석을 지원하는 무선 네트워크 인프라를 구축했다.

토마스는 "예를 들어 출입구가 닫힌다는 것은 다른 방법을 통해 500만 명의 관람객을 건물 안으로 입장시켜야 한다는 것을 뜻한다”고 말했다.

그는 "그게 절대 가벼운 일은 아니다. 매일 축구 관중과 같은 규모로 북적인다. 관객들이 어디에서 나타날지 잘 모른다. 만약 비라도 내리면 그 규모는 2배로 커질 것이다"고 이야기했다.

대자연의 세계를 보호하기 위한 개방형 데이터
자연사박물관에서 연간 700개 이상의 연구 논문을 발표하는 과학자들은 300여 명을 훌쩍 넘는다. 그들은 박물관에 있는 엄청난 소장품들에 귀중한 과학 지식을 숨겨 놓았을 수도 있었지만 그러는 대신 세계와 공유하는 쪽을 택했다.

토마스는 "이 점에 대해 매우 자세히 살펴보면, 우리가 무엇을 얻었는지 설명할 수 없을 것이며 사회도 똑같은 방식으로 상당한 이익을 얻을 수 없을 것이다”며 다음과 같이 말을 이었다.

"이게 바로 우리가 말한 데이터 개방을 기본으로 하겠다는 한 점이다. 우리는 상용성이 가장 뛰어난 일부 자산과 가장 민감한 자산에 매우 주의를 기울이고 있다. 상업적으로 쓰지 않는다는 동의 아래 라이선스를 부여하지만 대부분 공개적으로 사용할 수 있고 사람들은 그런 내용을 볼 수 있다. 우리는 사회를 위한 큰 그림을 생각한다."

박물관 소장품의 데이터를 공개함으로써 식량 안보, 기후 변화, 자연재해와 관련된 전세계적인 문제를 해결하는 데 도움을 줄 수 있다.

토마스는 "화산학자가 1920년대에 일어난 화산 분화에 관해 이야기하고 누군가는 폭발 당시 분출됐던 마그마를 20분마다 채취해 소규모 저장했던 것을 표본으로 추출했다”고 설명했다.

"이는 1920년대의 데이터를 담고 있는 폭발적인 사건이다. 마치 현대에 일어난 것처럼 그 당시 화산이 어떻게 폭발했는지를 알려줄 수 있기 때문이다. 그렇게 하지 않으면 당시 어떤 일이 있었는지 아무도 모를 것이다”고 그는 덧붙였다. ciokr@idg.co.kr
 



2018.06.20

'45억 년 역사 담은 8천 만 표본을 디지털로' 영국 자연사박물관

Thomas Macaulay | CIO UK
영국 자연사박물관이 CIO인 데이비드 토마스의 진두지휘 아래 새로운 관람객 경험을 창출하고 과학 연구를 고도화하기 위해 엄청난 규모의 소장 표본을 디지털화하고 있다.



영국 자연사박물관의 CIO인 데이비드 토마스는 45억 년의 삶을 기록한 8,000만 개의 동식물 표본을 디지털화하는 프로젝트를 진행하고 있다.

지난 250년 동안 수집된 400만 개 이상의 표본은 이제 국립 역사박물관 데이터 포털(National History Museum Data Portal)에서 활용할 수 있다. 5년 이내에 2,000만 개의 표본을 디지털화하는 것이 목표다.

토마스는 <CIO UK>와의 인터뷰에서 "대부분 박물관은 소장품 규모가 매우 작다. 대다수가 전시되어 있다"고 말했다.

그는 “자연사박물관에는 800만 개의 표본이 있고 그중 3,000개가 전시되어 있다. 따라서 디지털화가 가능하다는 것은 대중에게도 환상적이고 과학적인 목적에서도 훌륭하다"고 강조했다.

연구원들은 지구의 지질학에서 시작해서 태양계까지 다양한 주제들의 과거, 현재, 미래를 밝히기 위해 박물관에 있는 자료를 연구한다.

표본 자료는 기후, 생물 다양성, 인류 건강을 포함한 100개 이상의 과학 논문에서 이미 인용되었다.

기존의 연구원들은 물리적인 재료만 활용할 수 있었다. 이제는 선조들의 특징을 모방해서 그들이 퇴화하기 전을 재현한 ‘디지털 트윈’에도 접근할 수 있다.

토마스는 "소장품들은 정말 중요하다"며 “나는 어제 체더인(cheddar man)에서 추출한 DNA와 체더인 사진을 재연하면서 얻어낸 고대 DNA 추출물을 이용해 토론에 참여했다. 모든 것이 디지털화와 데이터에서 온 것이다"고 말했다.

디지털화 과정
7만 667장에 이르는 기생충 슬라이드부터 548년 된 책에 이르기까지 다양한 개체가 촬영이나 스캔 작업을 통해 3D 이미지로 변환된다. 객체 인식 소프트웨어는 표본을 분석하여 유형별로 자동 분류한다.

박물관은 머신러닝과 텍스트 인식을 활용해 대규모 표본에서 데이터를 추출한 다음 이미지에 라벨을 지정하는 방법도 실험하고 있다.

"이것들은 종류를 막론하고 매우 민감한 객체들이다”고 토마스는 말했다. 이어서 "현미경 내부일 수도 있고 대왕고래일 수도 있다. 움직이고 다루기에는 크기와 등급이 매우 다양하기 때문에 현장에서의 디지털화는 우리에게 정말로 중요하다"고 전했다.

디지털화는 연구 시간과 비용을 절약할 수 있을 뿐만 아니라 새로운 분석 방법을 제공해준다. 실제로 한 연구팀은 100년 이상의 기온 기록을 분석해 나비 관련 데이터를 조사하는 방법을 찾았다.

그들의 비교 연구는 온난화로 인해 브리티시 버터플라이(British butterflies) 종의 나비가 일찍 출현했고 유충이 먹을 수 있는 식물이 아직 확보되지 않은 상황에서 생존 가능성이 줄어들었다는 걸 보여준다.

디지털 박물관
영국 전체 박물관의 방문자 수가 감소하고 있다. 자연사박물관에는 지난해 440만 명이 방문했는데 이는 2016년에 비해 12% 감소한 수치다.

‘디지털 박물관’의 개념은 개인화된 혁신적인 경험을 만들어서 수익원을 높이고 새로운 매출 흐름을 발굴할 수 있다는 것이다.

관람객들은 데이비드 아텐버러 경이 마련한 증강현실을 경험해 볼 수 있다. 가상으로 표본을 보거나 변경사항이 생길 때마다 관심사에 맞게 최적화된 모바일 콘텐츠를 받아볼 수도 있다.

자연사박물관은 시스코와 제휴해 위치 기반 서비스와 트래픽 분석, 박물관 레이아웃 조정에 대한 실시간 분석을 지원하는 무선 네트워크 인프라를 구축했다.

토마스는 "예를 들어 출입구가 닫힌다는 것은 다른 방법을 통해 500만 명의 관람객을 건물 안으로 입장시켜야 한다는 것을 뜻한다”고 말했다.

그는 "그게 절대 가벼운 일은 아니다. 매일 축구 관중과 같은 규모로 북적인다. 관객들이 어디에서 나타날지 잘 모른다. 만약 비라도 내리면 그 규모는 2배로 커질 것이다"고 이야기했다.

대자연의 세계를 보호하기 위한 개방형 데이터
자연사박물관에서 연간 700개 이상의 연구 논문을 발표하는 과학자들은 300여 명을 훌쩍 넘는다. 그들은 박물관에 있는 엄청난 소장품들에 귀중한 과학 지식을 숨겨 놓았을 수도 있었지만 그러는 대신 세계와 공유하는 쪽을 택했다.

토마스는 "이 점에 대해 매우 자세히 살펴보면, 우리가 무엇을 얻었는지 설명할 수 없을 것이며 사회도 똑같은 방식으로 상당한 이익을 얻을 수 없을 것이다”며 다음과 같이 말을 이었다.

"이게 바로 우리가 말한 데이터 개방을 기본으로 하겠다는 한 점이다. 우리는 상용성이 가장 뛰어난 일부 자산과 가장 민감한 자산에 매우 주의를 기울이고 있다. 상업적으로 쓰지 않는다는 동의 아래 라이선스를 부여하지만 대부분 공개적으로 사용할 수 있고 사람들은 그런 내용을 볼 수 있다. 우리는 사회를 위한 큰 그림을 생각한다."

박물관 소장품의 데이터를 공개함으로써 식량 안보, 기후 변화, 자연재해와 관련된 전세계적인 문제를 해결하는 데 도움을 줄 수 있다.

토마스는 "화산학자가 1920년대에 일어난 화산 분화에 관해 이야기하고 누군가는 폭발 당시 분출됐던 마그마를 20분마다 채취해 소규모 저장했던 것을 표본으로 추출했다”고 설명했다.

"이는 1920년대의 데이터를 담고 있는 폭발적인 사건이다. 마치 현대에 일어난 것처럼 그 당시 화산이 어떻게 폭발했는지를 알려줄 수 있기 때문이다. 그렇게 하지 않으면 당시 어떤 일이 있었는지 아무도 모를 것이다”고 그는 덧붙였다. ciokr@idg.co.kr
 

X