2017.06.01

DNA, 차세대 기업용 스토리지 핵심 매체 될까

Lucas Mearian | Network World
마이크로소프트가 DNA 기반 스토리지 기술 개발에 박차를 가하고 있다. 이 기기는 3년 이내에 상용화될 것으로 예상된다.



마이크로소프트는 지난해 DNA를 스토리지 매체로 활용할 수 있는 연구결과를 공개했다. 당시 업체는 이 기술을 이용하면 대형 데이터센터를 몇 개의 각설탕으로 압축한 것처럼 많은 양의 데이터를 보관할 수 있다고 밝혔다. 인터넷에서 공개적으로 접근 가능한 모든 데이터를 신발 상자 크기 정도에 넣을 수 있다. 이 기술을 확장하고 일련의 기술적 장애물을 극복하면 DNA 스토리지의 장점을 본격 활용할 수 있게 될 것이라고 설명했다.

이후 마이크로소프트는 DNA 스토리지 연구 진척 상황에 대해 함구해 왔는데, 최근 마이크로소프트 리서치(Microsoft Research)의 파트너 설계자 더그 카르미안이 MIT 테크놀로지 리뷰(MIT Technology Review)에 기고를 했다. 이를 통해 그는 “3년 이내에 최소한 하나의 애플리케이션을 위해 데이터센터 중 한 곳의 DNA에 일정량의 데이터를 저장할 수 있는 최초 상용 시스템 개발을 완료할 예정이다"고 밝혔다.

카르미안에 따르면, 현재 이 기기는 1970년대의 대형 제록스(Xerox) 복사기 크기 정도로 데이터 쓰기 속도가 40MBps에 불과하다. 자기 테이프 드라이브 등 다른 저장 보관 매체와 경쟁하려면 100MBps까지 높일 필요가 있다.

IDC의 연구 책임자 나탈리아 예즈코바는 디지털 데이터 양이 믿기 어려운 속도로 커지고 있으므로 10~15년 후에는 DNA형 스토리지 매체가 필요하게 될 것으로 전망했다. 그는 “현재 이 성장에 대응할 수 있는 유일한 방법은 압축 또는 중복 제거 등 데이터 최적화 기법을 발전시키는 것이다. 이 방법도 의미가 있고 데이터 폭증에 일부 대응할 수 있지만 장기적으로 보면 완전히 새로운 방식이 필요하다"고 말했다.

예를 들어 일부 의료 데이터는 환자의 일생 저장해야 하며 감사 및 민사 소송을 위한 연방 규정은 일부 금융 기록을 7년 이상 보관하도록 하고 있다. 또한 빅데이터 분석이 발전하면서 더 많은 기업이 저장해 놓은 영업 및 고객 데이터에서 유용한 마케팅 정보를 뽑아낼 방법을 찾고 있다. 모든 스마트폰 사용자가 만들어 클라우드 서비스에 저장하는 동영상과 사진, 오디오 파일도 엄청난 규모이다.

마이크로소프트와 UW의 DNA 스토리지 연구자들은 디지털 데이터의 1과 0으로 구성된 긴 문자열을 As, Gs, Cs, Ts 등으로 나타내는 4개의 기본적인 DNA 시퀀스 블록(Adenine, Guanine, Cytosine, Thymine)으로 변환하는 일명 “참신한 접근방식(novel approach)”을 개발했다.

디지털 데이터를 조각으로 나누어 작은 DNA 분자로 구성된 거대한 숫자로 합성하여 보관할 수 있으며 장기 보관을 위해 탈수 및 보존이 가능하다. 저장된 데이터에 접근하기 위해 연구원은 우편번호와 거리 주소를 DNA 시퀀스로 부호화한다. 분자 생물학에서 보편적으로 사용되는 PCR(Polymerase Chain Reaction) 기법은 이 우편번호를 쉽게 식별하는데 도움이 된다.



DNA는 이론적으로 밀리미터당 1엑사바이트(Exabyte) 이상을 저장할 수 있다. 자기 테이프보다 8자리 수나 밀도가 높은 것이다. 또한 DNA 기반 스토리지는 저장 기간이 사실상 무한하다. DNA 기반의 생명체가 존재하는 한 DNA를 읽고 조작할 강력한 이유가 계속될 것이라고 연구원은 논문을 통해 주장했다.

클라우드 서비스 및 초대형 컴퓨팅 공급 업체들은 점차 복잡하고 느려지는 많은 양의 데이터를 저장할 수 있는 새로운 방법을 찾고 있고 DNA 스토리지가 상용화되면 첫 고객사는 이런 업체가 될 전망이다. 아마존 글레이시어(Amazon Glacier) 또는 구글의 클라우드 플랫폼(Cloud Platform) 같은 클라우드 저장 서비스는 오늘날 대부분의 주요 기술보다 전반적으로 용량이 크고 수명이 긴 스토리지 매체를 위한 후보가 될 것이다.

예즈코바는 “50년 이상 접근하지 않을 가능성이 있는 많은 양의 데이터를 저장할 때는 속도와 경제성 사이의 균형이 중요하다. 아마존 또는 구글도 DNA 스토리지를 연구하고 있을 가능성이 꽤 크다. 이런 기술을 반드시 공개적으로 개발할 필요는 없다"고 말했다.

이어 "DNA 스토리지는 가능성이 큰 만큼 상용화에 앞서 기술적으로 해결해야 할 숙제가 많다. 기존 애플리케이션 및 하드웨어와의 호환성 등이 대표적이다. 이런 문제를 해결할 수만 있다면 엄청난 영향을 끼칠 것이다"고 덧붙였다.

IDC의 디지털 유니버스(Digital Universe) 연구 결과를 보면 2005년 이후 전자 데이터의 양이 2년마다 두 배로 증가하고 있다. 2005년부터 2020년까지 전 세계적으로 생성된 전자 데이터의 양은 130엑사바이트에서 4만 엑사바이트 또는 40조 기가바이트(Gigabyte)까지 성장할 것으로 전망된다. 1인당 5,200GB가 넘는 엄청난 규모지만, 이 조차도 분석적 가치를 위해 일부만을 계산한 것이다. IDC는 2020년까지 디지털 유니버스의 33%에 분석 시 가치가 있을 수 있는 정보가 포함될 것으로 전망했다.

또한 IDC는 2020년까지 디지털 유니버스의 정보 중 약 40%를 클라우드 컴퓨팅 제공자가 '취급'할 것으로 전망했다. 즉, 1바이트가 생성자에서 시작하여 폐기될 때까지 어디에선가 클라우드에 저장되거나 거쳐간다는 의미이다.

---------------------------------------------------------------
데이터센터 인기기사
-> 데이터센터를 안전하게! 물리적 보안 구축법
-> 규모로 승부하는 데이터센터들
-> ‘인프라도 스타급!’ 헐리우드의 엘리트 데이터센터들
-> '동굴, 벙커, 사막···' 쿨하고 쿨한 데이터센터 9곳
-> 데이터센터 위한 필수 장비 10종
-> 구글이 말하는 5가지 데이터센터 에너지 절약법
-> IT 전문가들이 선정한 필수 데이터센터 유틸리티 7선
-> 데이터센터 효율성 개선을 위한 6가지 팁테크
-> 컨버지드 인프라, 데이터센터의 미래인가?
-> ‘데이터센터 비용 절감’ 페이스북의 오픈소스 디자인 활용법
-> 8가지 획기적인 데이터센터 전력 비용 절감 방안
---------------------------------------------------------------

지난 해, 마이크로소프트와 UW(University of Washington)의 연구원들은 합성 DNA 가닥에 200MB의 데이터를 저장해 세계 기록을 경신했다고 밝혔다. 이 기록에서 합성 DNA에 부호화 했다가 복호화 할 수 있는 데이터의 양 뿐만이 아니라 이를 저장할 수 있는 공간도 중요한 의미를 갖는다. 카르미안은 "부호화한 데이터는 테스트 튜브 안에서 연필심보다 훨씬 작은 공간을 차지한다"고 말했다.

또한 DNA 스토리지는 가혹한 환경에서도 반감기가 500년에 달한다. 방사성 물질과 마찬가지로 DNA의 반감기는 붕괴 속도를 결정한다. 오늘날의 주요 스토리지 매체인 자기 테이프, 하드 디스크 드라이브, 광학 디스크, NAND 플래시 스토리지의 최대 수명이 5년에서 수십 년인 것을 고려하면 상당히 길다는 것을 알 수 있다.

한편, IDC에 따르면, 보호가 필요한 디지털 유니버스의 데이터 비율은 2010년의 1/3에서 2020년 40% 이상으로 빠르게 증가하고 있다. 예즈코바는 “사물 인터넷(Internet of Things)과 빅데이터 분석 등의 프로젝트로 인해 저장해야 하는 데이터의 양은 지속적으로 증가할 것이다. 업계에서는 이 모든 데이터를 저장하는 방법에 대한 문제를 항상 고민하고 있다”고 말했다. ciokr@idg.co.kr 



2017.06.01

DNA, 차세대 기업용 스토리지 핵심 매체 될까

Lucas Mearian | Network World
마이크로소프트가 DNA 기반 스토리지 기술 개발에 박차를 가하고 있다. 이 기기는 3년 이내에 상용화될 것으로 예상된다.



마이크로소프트는 지난해 DNA를 스토리지 매체로 활용할 수 있는 연구결과를 공개했다. 당시 업체는 이 기술을 이용하면 대형 데이터센터를 몇 개의 각설탕으로 압축한 것처럼 많은 양의 데이터를 보관할 수 있다고 밝혔다. 인터넷에서 공개적으로 접근 가능한 모든 데이터를 신발 상자 크기 정도에 넣을 수 있다. 이 기술을 확장하고 일련의 기술적 장애물을 극복하면 DNA 스토리지의 장점을 본격 활용할 수 있게 될 것이라고 설명했다.

이후 마이크로소프트는 DNA 스토리지 연구 진척 상황에 대해 함구해 왔는데, 최근 마이크로소프트 리서치(Microsoft Research)의 파트너 설계자 더그 카르미안이 MIT 테크놀로지 리뷰(MIT Technology Review)에 기고를 했다. 이를 통해 그는 “3년 이내에 최소한 하나의 애플리케이션을 위해 데이터센터 중 한 곳의 DNA에 일정량의 데이터를 저장할 수 있는 최초 상용 시스템 개발을 완료할 예정이다"고 밝혔다.

카르미안에 따르면, 현재 이 기기는 1970년대의 대형 제록스(Xerox) 복사기 크기 정도로 데이터 쓰기 속도가 40MBps에 불과하다. 자기 테이프 드라이브 등 다른 저장 보관 매체와 경쟁하려면 100MBps까지 높일 필요가 있다.

IDC의 연구 책임자 나탈리아 예즈코바는 디지털 데이터 양이 믿기 어려운 속도로 커지고 있으므로 10~15년 후에는 DNA형 스토리지 매체가 필요하게 될 것으로 전망했다. 그는 “현재 이 성장에 대응할 수 있는 유일한 방법은 압축 또는 중복 제거 등 데이터 최적화 기법을 발전시키는 것이다. 이 방법도 의미가 있고 데이터 폭증에 일부 대응할 수 있지만 장기적으로 보면 완전히 새로운 방식이 필요하다"고 말했다.

예를 들어 일부 의료 데이터는 환자의 일생 저장해야 하며 감사 및 민사 소송을 위한 연방 규정은 일부 금융 기록을 7년 이상 보관하도록 하고 있다. 또한 빅데이터 분석이 발전하면서 더 많은 기업이 저장해 놓은 영업 및 고객 데이터에서 유용한 마케팅 정보를 뽑아낼 방법을 찾고 있다. 모든 스마트폰 사용자가 만들어 클라우드 서비스에 저장하는 동영상과 사진, 오디오 파일도 엄청난 규모이다.

마이크로소프트와 UW의 DNA 스토리지 연구자들은 디지털 데이터의 1과 0으로 구성된 긴 문자열을 As, Gs, Cs, Ts 등으로 나타내는 4개의 기본적인 DNA 시퀀스 블록(Adenine, Guanine, Cytosine, Thymine)으로 변환하는 일명 “참신한 접근방식(novel approach)”을 개발했다.

디지털 데이터를 조각으로 나누어 작은 DNA 분자로 구성된 거대한 숫자로 합성하여 보관할 수 있으며 장기 보관을 위해 탈수 및 보존이 가능하다. 저장된 데이터에 접근하기 위해 연구원은 우편번호와 거리 주소를 DNA 시퀀스로 부호화한다. 분자 생물학에서 보편적으로 사용되는 PCR(Polymerase Chain Reaction) 기법은 이 우편번호를 쉽게 식별하는데 도움이 된다.



DNA는 이론적으로 밀리미터당 1엑사바이트(Exabyte) 이상을 저장할 수 있다. 자기 테이프보다 8자리 수나 밀도가 높은 것이다. 또한 DNA 기반 스토리지는 저장 기간이 사실상 무한하다. DNA 기반의 생명체가 존재하는 한 DNA를 읽고 조작할 강력한 이유가 계속될 것이라고 연구원은 논문을 통해 주장했다.

클라우드 서비스 및 초대형 컴퓨팅 공급 업체들은 점차 복잡하고 느려지는 많은 양의 데이터를 저장할 수 있는 새로운 방법을 찾고 있고 DNA 스토리지가 상용화되면 첫 고객사는 이런 업체가 될 전망이다. 아마존 글레이시어(Amazon Glacier) 또는 구글의 클라우드 플랫폼(Cloud Platform) 같은 클라우드 저장 서비스는 오늘날 대부분의 주요 기술보다 전반적으로 용량이 크고 수명이 긴 스토리지 매체를 위한 후보가 될 것이다.

예즈코바는 “50년 이상 접근하지 않을 가능성이 있는 많은 양의 데이터를 저장할 때는 속도와 경제성 사이의 균형이 중요하다. 아마존 또는 구글도 DNA 스토리지를 연구하고 있을 가능성이 꽤 크다. 이런 기술을 반드시 공개적으로 개발할 필요는 없다"고 말했다.

이어 "DNA 스토리지는 가능성이 큰 만큼 상용화에 앞서 기술적으로 해결해야 할 숙제가 많다. 기존 애플리케이션 및 하드웨어와의 호환성 등이 대표적이다. 이런 문제를 해결할 수만 있다면 엄청난 영향을 끼칠 것이다"고 덧붙였다.

IDC의 디지털 유니버스(Digital Universe) 연구 결과를 보면 2005년 이후 전자 데이터의 양이 2년마다 두 배로 증가하고 있다. 2005년부터 2020년까지 전 세계적으로 생성된 전자 데이터의 양은 130엑사바이트에서 4만 엑사바이트 또는 40조 기가바이트(Gigabyte)까지 성장할 것으로 전망된다. 1인당 5,200GB가 넘는 엄청난 규모지만, 이 조차도 분석적 가치를 위해 일부만을 계산한 것이다. IDC는 2020년까지 디지털 유니버스의 33%에 분석 시 가치가 있을 수 있는 정보가 포함될 것으로 전망했다.

또한 IDC는 2020년까지 디지털 유니버스의 정보 중 약 40%를 클라우드 컴퓨팅 제공자가 '취급'할 것으로 전망했다. 즉, 1바이트가 생성자에서 시작하여 폐기될 때까지 어디에선가 클라우드에 저장되거나 거쳐간다는 의미이다.

---------------------------------------------------------------
데이터센터 인기기사
-> 데이터센터를 안전하게! 물리적 보안 구축법
-> 규모로 승부하는 데이터센터들
-> ‘인프라도 스타급!’ 헐리우드의 엘리트 데이터센터들
-> '동굴, 벙커, 사막···' 쿨하고 쿨한 데이터센터 9곳
-> 데이터센터 위한 필수 장비 10종
-> 구글이 말하는 5가지 데이터센터 에너지 절약법
-> IT 전문가들이 선정한 필수 데이터센터 유틸리티 7선
-> 데이터센터 효율성 개선을 위한 6가지 팁테크
-> 컨버지드 인프라, 데이터센터의 미래인가?
-> ‘데이터센터 비용 절감’ 페이스북의 오픈소스 디자인 활용법
-> 8가지 획기적인 데이터센터 전력 비용 절감 방안
---------------------------------------------------------------

지난 해, 마이크로소프트와 UW(University of Washington)의 연구원들은 합성 DNA 가닥에 200MB의 데이터를 저장해 세계 기록을 경신했다고 밝혔다. 이 기록에서 합성 DNA에 부호화 했다가 복호화 할 수 있는 데이터의 양 뿐만이 아니라 이를 저장할 수 있는 공간도 중요한 의미를 갖는다. 카르미안은 "부호화한 데이터는 테스트 튜브 안에서 연필심보다 훨씬 작은 공간을 차지한다"고 말했다.

또한 DNA 스토리지는 가혹한 환경에서도 반감기가 500년에 달한다. 방사성 물질과 마찬가지로 DNA의 반감기는 붕괴 속도를 결정한다. 오늘날의 주요 스토리지 매체인 자기 테이프, 하드 디스크 드라이브, 광학 디스크, NAND 플래시 스토리지의 최대 수명이 5년에서 수십 년인 것을 고려하면 상당히 길다는 것을 알 수 있다.

한편, IDC에 따르면, 보호가 필요한 디지털 유니버스의 데이터 비율은 2010년의 1/3에서 2020년 40% 이상으로 빠르게 증가하고 있다. 예즈코바는 “사물 인터넷(Internet of Things)과 빅데이터 분석 등의 프로젝트로 인해 저장해야 하는 데이터의 양은 지속적으로 증가할 것이다. 업계에서는 이 모든 데이터를 저장하는 방법에 대한 문제를 항상 고민하고 있다”고 말했다. ciokr@idg.co.kr 

X