2021.01.22

웬디스코, ‘KOBIC’에 라이브 데이터 솔루션 무상 제공…“코로나19 연구 개발 활용”

편집부 | CIO KR
영국의 라이브 데이터 기업 웬디스코(WANdisco)가 한국생명공학연구원 국가생명연구자원정보센터(이하 KOBIC)에 데이터 복제 소프트웨어를 무상 기증했다고 밝혔다. 

KOBIC은 국가 차원의 정보 인프라를 구축해 생명 연구 자원 확보와 관리를 지원하는 정부 지정 연구기관이다. KOBIC은 국가생명연구자원 통합정보시스템 구축 및 운영의 일환으로 대용량 유전체 분석용 클라우드 서비스인 ‘바이오 익스프레스(Bio-Express)’를 제공하고 있다. 

KOBIC은 지난해 3월부터는 코로나19 연구를 위해 전 세계에 흩어져 있는 코로나19 관련 유전체와 단백체 데이터를 수집해 정보를 제공하는 ‘코로나19 연구정보 포털(kobic.re.kr/covid19)’를 오픈해 연구자들에게 제공하고 있다. 하지만 KOBIC은 보유한 대용량 유전체데이터와 바이오 익스프레스 사용자가 급격히 늘어남에 따라 빅데이터 플랫폼의 데이터 처리 성능 문제가 발생했다.  

바이오 익스프레스를 이용한 고속 데이터 분석 시, 서로 다른 운영 환경의 분석 도구들을 지원하기 위한 하둡 기반 분산파일시스템(HDFS, Hadoop Distributed File System)과 리눅스/유닉스 기반 러스터 파일시스템(Lustre file system) 간 대용량 데이터의 양방향 복제에 많은 시간이 소요됐다. 참고로 바이오 익스프레스에서는 하루 평균 약 20TB(테라바이트) 정도의 데이터 복제가 발생하여 전체 처리시간의 40% 이상을 소비하고 있었다.



이에 KOBIC의 김판규 전산개발실장은 데이터 복제에 과도한 시간이 소요되는 문제의 해결책으로 웬디스코의 솔루션을 찾았다. 웬디스코가 기증한 라이브 데이터 플레인은 데이터 가용성과 일관성을 보장하면서 동시에 대용량 데이터 복제시간을 단축할 수 있다.  

웬디스코 백지훈 한국 지사장은 “웬디스코는 2020년 1분기 연구기관을 대상으로 라이브 데이터 플레인 솔루션 무료 기증을 발표했다”라며, “한국의 경우 KOBIC의 아키텍처 개선을 위해 웬디스코 글로벌 세일즈 선임부사장인 키이스 그래함이 영구 라이선스 기증과 함께 인력까지 추가로 지원해 KOBIC의 차세대 바이오 익스프레스 환경에 맞게 데이터 복제 방식을 적용했다”라고 밝혔다.

KOBIC은 2020년 하반기 웬디스코의 도움으로 빅데이터 플랫폼의 고속 복제 환경을 구현했고, 이를 2021년 오픈할 바이오 익스프레스 차기 버전에 반영할 예정이다. KOBIC은 웬디스코 솔루션을 적용해 바이오 익스프레스 서비스를 이용한 대용량 유전체 분석 효율을 크게 높일 것으로 기대하고 있다. 

KOBIC 전산개발팀 고건환 연구원은 “KOBIC은 웬디스코 라이브 데이터 플랫폼을 하둡 기반 분석 클러스터와 리눅스 기반 분석 클러스터 간 복제에 활용함으로써 기존보다 13배 빠르게 파일을 복제할 수 있게 되었다”라며, “바이오 익스프레스 서비스의 전체 평균 분석 시간을 30% 이상 단축했다”라고 말했다. ciokr@idg.co.kr



2021.01.22

웬디스코, ‘KOBIC’에 라이브 데이터 솔루션 무상 제공…“코로나19 연구 개발 활용”

편집부 | CIO KR
영국의 라이브 데이터 기업 웬디스코(WANdisco)가 한국생명공학연구원 국가생명연구자원정보센터(이하 KOBIC)에 데이터 복제 소프트웨어를 무상 기증했다고 밝혔다. 

KOBIC은 국가 차원의 정보 인프라를 구축해 생명 연구 자원 확보와 관리를 지원하는 정부 지정 연구기관이다. KOBIC은 국가생명연구자원 통합정보시스템 구축 및 운영의 일환으로 대용량 유전체 분석용 클라우드 서비스인 ‘바이오 익스프레스(Bio-Express)’를 제공하고 있다. 

KOBIC은 지난해 3월부터는 코로나19 연구를 위해 전 세계에 흩어져 있는 코로나19 관련 유전체와 단백체 데이터를 수집해 정보를 제공하는 ‘코로나19 연구정보 포털(kobic.re.kr/covid19)’를 오픈해 연구자들에게 제공하고 있다. 하지만 KOBIC은 보유한 대용량 유전체데이터와 바이오 익스프레스 사용자가 급격히 늘어남에 따라 빅데이터 플랫폼의 데이터 처리 성능 문제가 발생했다.  

바이오 익스프레스를 이용한 고속 데이터 분석 시, 서로 다른 운영 환경의 분석 도구들을 지원하기 위한 하둡 기반 분산파일시스템(HDFS, Hadoop Distributed File System)과 리눅스/유닉스 기반 러스터 파일시스템(Lustre file system) 간 대용량 데이터의 양방향 복제에 많은 시간이 소요됐다. 참고로 바이오 익스프레스에서는 하루 평균 약 20TB(테라바이트) 정도의 데이터 복제가 발생하여 전체 처리시간의 40% 이상을 소비하고 있었다.



이에 KOBIC의 김판규 전산개발실장은 데이터 복제에 과도한 시간이 소요되는 문제의 해결책으로 웬디스코의 솔루션을 찾았다. 웬디스코가 기증한 라이브 데이터 플레인은 데이터 가용성과 일관성을 보장하면서 동시에 대용량 데이터 복제시간을 단축할 수 있다.  

웬디스코 백지훈 한국 지사장은 “웬디스코는 2020년 1분기 연구기관을 대상으로 라이브 데이터 플레인 솔루션 무료 기증을 발표했다”라며, “한국의 경우 KOBIC의 아키텍처 개선을 위해 웬디스코 글로벌 세일즈 선임부사장인 키이스 그래함이 영구 라이선스 기증과 함께 인력까지 추가로 지원해 KOBIC의 차세대 바이오 익스프레스 환경에 맞게 데이터 복제 방식을 적용했다”라고 밝혔다.

KOBIC은 2020년 하반기 웬디스코의 도움으로 빅데이터 플랫폼의 고속 복제 환경을 구현했고, 이를 2021년 오픈할 바이오 익스프레스 차기 버전에 반영할 예정이다. KOBIC은 웬디스코 솔루션을 적용해 바이오 익스프레스 서비스를 이용한 대용량 유전체 분석 효율을 크게 높일 것으로 기대하고 있다. 

KOBIC 전산개발팀 고건환 연구원은 “KOBIC은 웬디스코 라이브 데이터 플랫폼을 하둡 기반 분석 클러스터와 리눅스 기반 분석 클러스터 간 복제에 활용함으로써 기존보다 13배 빠르게 파일을 복제할 수 있게 되었다”라며, “바이오 익스프레스 서비스의 전체 평균 분석 시간을 30% 이상 단축했다”라고 말했다. ciokr@idg.co.kr

X