IBM의 빅데이터, 천문학 연구 돕는다

Computerworld
스퀘어 킬로미터 어레이(SKA) 망원경에서 취합한 거대한 데이터로 천문학자들이 연구 효율을 높여줄 소프트웨어 아키텍처의 표준 버전이 완성했다.

스카 프로젝트는 경쟁 입찰에서 누가 수주하느냐에 따라 호주, 뉴질랜드 또는 남아프리카에 널리 퍼져 있는 인공위성을 통해 전파 자원의 정확한 관찰을 예측할 수 있게 성능을 나타낼 것이다. 내년 초에 입찰이 결정된다.

IBM의 정보 집중 프레임워크(IIF)는 표준 분류 체계를 참고로, 천문학의 많은 물체들을 자동으로 분류해 준다. 천문학자들은 일상적인 관찰물 가운데 엄청난 규모의 로데이터보다 오히려 ‘은하계’나 ‘초대형 무게의 블랙홀’이라고 하는 물체들을 다룰 수 있다.

이 프로젝트는 천문학자의 머리 속에 있는 지식을 가져와 시스템에 넣는 것이다. 천문학자들이 공식에 따라서 직접 해오던 일들을 자동화할 수 있다고 IBM뉴질랜드의 CTO이자 뉴질랜드 스카 산업 컨소시엄의 의장인 듀갈 와트가 말했다.

이 시스템 개발에는 뉴질랜드 웰링턴의 빅토리아대학교의 전파-천문학자인 멜라니 존스턴-홀릿과 공동으로 참여했다. 이 시스템은 국제 가상 천문대 얼라이언스가 개발한 천문 분류체계를 기반으로 하며 W3C 컨소시엄이 유지보수하는 온톨로지 웹 언어(OWL)를 사용한다.

"중요한 것은 천문학자들이 좀더 효율적이고 생산을 높일 수 있게 됐다는 점이다. 그래서 이 학자들은 창의적인 일을 하는 데 시간을 보낼 수 있게 됐다"라고 와트는 말했다. "이는 마치 천문학자들이 문법과 카탈로그의 구조를 배운 다음 매우 시간 소모적인 일을 하는 것과 흡사하다. 학자들은 본연의 연구에 더 많은 시간을 할애하고 싶어한다"라고 와트는 강조했다.

와트는 일상적인 카탈로그 작업이 안정화되면서 천문학자들은 우주에 대한 연구에 좀더 시간을 투자할 수 있게 될 것이라고 말했다.

"우리는 기계 학습과 소셜 네트워킹에 이것을 연결할 수 있을 거라 생각한다. 우리는 웹 포털에 ‘이 물체를 분류하지 못했고 그림은 여기 있다’라는 팝업창을 띄워 다음 사람이 이것을 보고 분류할 수 있기를 바란다. 그래서 많은 사람들이 여기에 동참하길 바란다. 포털에서 여러 사람의 의견이 분분할 수 있다. 그러다가 합의점에 도달할 수 있을 것이다. 이 시스템을 통해 새로운 물체가 분류되면, 나중에 같은 작업을 하지 않고도 쉽게 정리할 수 있다”라고 와트는 설명했다.

시간이 지남에 따라 프레임워크도 물체의 변화를 간파할 수 있다. 프레임워크가 하늘의 특정 위치에 특정 유형의 물체와 1주일이나 1년 후에 나타날 물체의 또다른 종류를 주시한다면, 그 위치에서 뭔가 변화를 감지하고 전세계 망원경을 동원해 관찰한다고 와트는 말했다.

천문학의 적용 사례와 비슷하게 다른 전문 분야로도 확대할 수 있다. 특히 신속하고 정확한 진단이나 품질 개선이 필요한 의학이나 제조와 같은 전문 영역에 적용할 수 있다고 와트는 제안했다.

와트에 따르면, 표준 개념을 정립하고 난 다음 단계는 일부 천문학자와 함께 앉아 이 진짜 실험으로 옮겨가 천문학의 현 주소와 자동화할 수 있는 것이 무엇인지를 파악하는 것이다. 이와 같은 일은 병렬 처리 기법을 통해 프레임워크의 성능을 향상시킬 수 있다고 와트는 덧붙였다. ciokr@idg.co.kr