Offcanvas

빅데이터 | 애널리틱스 / 신기술|미래 / 클라우드

아마존, 클라우드에 1,700명의 유전자 정보 저장

2012.03.30 Brandon Butler  |  Network World
아마존 웹 서비스가 1,700명의 유전자 정보를 자사 퍼블릭 클라우드에 저장했고 전세계 누구라도 여기에 접근할 수 있다고 밝혔다.

200TB 데이터는 미국 국립보건원(National Institutes of Health)과 75개 기업 및 기관들과 파트너십을 맺어 공동으로 진행하는 1000 게놈 프로젝트의 일환으로 확보된 것이다. 이 프로젝트의 목표는 과학 연구를 위해 최종적으로 전세계에서 2,662명의 유전자 정보를 저장하는 것이다. 특히 연구진들은 질병 연구하기 위해 표본을 통해 1% 이상의 빈도를 나타내는 유전적 다양성을 찾고 있다.

AWS로 게놈 정보를 넣으면 AWS의 서버에 저장되며 이는 전세계에서 활용할 수 있는 가장 거대한 인간 유전자의 집합이 될 것이라고 아마존은 전했다. 현재 AWS는 데이터 저장과 접근을 무료로 제공하지만, 데이터를 분석하기 위해 필요한 추가 컴퓨팅 파워를 사용하는 데는 비용을 부과하고 있다. AWS는 사용자가 AWS의 엘라스틱 컴퓨트 클라우드(EC2)나 엘라스틱 맵리듀스 컴퓨팅 서비스에서 실행하는 하둡을 이용할 수 있다고 밝혔다. 엘라스틱 맵리듀스 컴퓨팅 서비스는 심플 스토리지 서비스(S3)에 저장된 데이터를 분석해 준다.

1,700개 이상의 게놈 데이터세트의 대부분은 익명의 개인들에게 취합했다. 1만 게놈 프로젝트는 참가자들의 개인 정보에 대한 동의를 구하는 윤리 기준을 준수해 진행됐다. 이 프로젝트는 이미 전세계 곳곳에서 인구 표본에서 데이터를 취합했다. 북동유럽에서 조상들이 미국으로 이주하고 현재 유타 주에 거주하는 사람들, 덴버에 사는 중국계, 로스앤젤레스에 사는 멕시코계, 미국 남서부에 사는 아프리카계 등의 게놈 정보를 담았다.

AWS는 백악관에서 열린 빅 데이터 서밋에서 이러한 내용들을 발표했다. 빅 데이터 서밋에서 정부와 연구원들은 빅 데이터가 가져올 도전과 기회를 논의했다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.