2012.06.21

기고 | 오픈소스, 빅 데이터 애플리케이션의 미래 이끈다

Bertrand Diard | Network World

‘빅 데이터’라는 용어가 정립된 것은 비교적 최근인 2009년의 일이지만, 이는 가상화(virtualization)의 열풍과 맞물려 빠른 속도로 정보 기술 시장의 주류로 자리를 잡았다. 이제 기업에 유입되는 데이터의 규모는 TB, 아니 페타바이트(PB)에 이른다.

세계 곳곳으로부터 쏟아져 들어오는 데이터의 규모가 기하급수적으로 증가함에 따라, 이를 분석하고 가공하는 작업은 이전과는 비교할 수 없을 정도로 복잡해졌으며, 또한 기업의 성패를 좌우하는 주요한 요인으로 자리 잡기 시작했다.

조사 기업 위키본(Wikibon)에 따르면, 빅 데이터 시장의 성장은 지속적으로 가속화돼 향후 5년 내 500억 달러에 이를 것으로 전망된다. 데이터 양의 증대는 기업들에게 그들의 인프라를 새로이 검토해야 하는 과제를 안겨주었다. 이제 기술과 기존 시스템, 그리고 라이선싱 모델에 대한 전통적인 ‘확충' 방법론은 더 이상 유효하지 않게 되었다.

오늘날 대량 데이터 관리 작업을 선봉에서 이끄는 요소를 꼽으라면 단연 오픈소스 기술일 것이다. 오픈소스는 이와 같은 대규모 문제들을 효율적으로 해결하고 작업을 더 빠르고 정확하게, 그리고 경제적으로 진행될 수 있도록 지원하는 솔루션으로 주목 받고 있다.

->주목! 9가지 오픈소스 빅 데이터 기술

오픈소스 데이터와 애널리틱스 제품은 더 이상 위험한 도박으로 여겨지지 않는다. 이들은 이제 자체 소프트웨어의 대안으로 비즈니스 속에 완전히 녹아 들어갔다. 안정적 토대 위에 구축된 툴과 테크놀로지를 통해 오픈소스는 강력하고 경제적인 기업 애플리케이션과 인프라를 구성하는 핵심으로 떠오르고 있다. IT커뮤니티를 넘어서 모든 규모와 유형의 기업들에 이르기까지, 오픈소스 테크놀로지는 주류로 자리 잡은 것이다.

이러한 주장을 뒷받침해주는 각종 조사자료들이 있다. 2011년, 벤처캐피탈의 오픈소스 관련 업체들에 대한 투자 규모는 전년 대비 48% 증가한 6억 7,280만 달러를 기록하며 역대 최고치를 경신했다.

새로운 세계에서 혁신
대부분의 신형 빅 데이터 프레임워크와 데이터베이스는 오픈소스 환경에 그 근간을 두고 있다. 이 환경에서, 개발자들은 주류 시장에서 다뤄지지 않았던 새로운 문제 해결 방법론을 끊임없이 개발해내고 있다. 페이스북, 야후, 아마존, 트위터, 이베이와 같은 대형 온라인 커뮤니케이션 및 데이터 전송 서비스 공급자들은 혁신적인 오픈소스 개발을 지원하며 이를 이용하고 있다. 이제 오픈소스를 빼놓고는 빅 데이터의 가치와 성장을 논할 수 없게 됐다.

하둡은 빅 데이터 테크놀로지 시장의 견인차와 같은 존재다. 오늘날 빅 데이터 시장의 주된 트렌드는 오픈소스 아파치 하둡 플랫폼을 활용하는 방향으로 흘러가고 있으며, 클라우데라나 호튼웍스, 맵R(MapR)과 같은 업체들은 이를 지원하고 확장해 혁신을 주도하고 있기도 하다. 이들 업체들은 IBM이나 마이크로소프트와 같은 전통적인 대형 소프트웨어 업체들을 위협할 정도로 성장했다.




2012.06.21

기고 | 오픈소스, 빅 데이터 애플리케이션의 미래 이끈다

Bertrand Diard | Network World

‘빅 데이터’라는 용어가 정립된 것은 비교적 최근인 2009년의 일이지만, 이는 가상화(virtualization)의 열풍과 맞물려 빠른 속도로 정보 기술 시장의 주류로 자리를 잡았다. 이제 기업에 유입되는 데이터의 규모는 TB, 아니 페타바이트(PB)에 이른다.

세계 곳곳으로부터 쏟아져 들어오는 데이터의 규모가 기하급수적으로 증가함에 따라, 이를 분석하고 가공하는 작업은 이전과는 비교할 수 없을 정도로 복잡해졌으며, 또한 기업의 성패를 좌우하는 주요한 요인으로 자리 잡기 시작했다.

조사 기업 위키본(Wikibon)에 따르면, 빅 데이터 시장의 성장은 지속적으로 가속화돼 향후 5년 내 500억 달러에 이를 것으로 전망된다. 데이터 양의 증대는 기업들에게 그들의 인프라를 새로이 검토해야 하는 과제를 안겨주었다. 이제 기술과 기존 시스템, 그리고 라이선싱 모델에 대한 전통적인 ‘확충' 방법론은 더 이상 유효하지 않게 되었다.

오늘날 대량 데이터 관리 작업을 선봉에서 이끄는 요소를 꼽으라면 단연 오픈소스 기술일 것이다. 오픈소스는 이와 같은 대규모 문제들을 효율적으로 해결하고 작업을 더 빠르고 정확하게, 그리고 경제적으로 진행될 수 있도록 지원하는 솔루션으로 주목 받고 있다.

->주목! 9가지 오픈소스 빅 데이터 기술

오픈소스 데이터와 애널리틱스 제품은 더 이상 위험한 도박으로 여겨지지 않는다. 이들은 이제 자체 소프트웨어의 대안으로 비즈니스 속에 완전히 녹아 들어갔다. 안정적 토대 위에 구축된 툴과 테크놀로지를 통해 오픈소스는 강력하고 경제적인 기업 애플리케이션과 인프라를 구성하는 핵심으로 떠오르고 있다. IT커뮤니티를 넘어서 모든 규모와 유형의 기업들에 이르기까지, 오픈소스 테크놀로지는 주류로 자리 잡은 것이다.

이러한 주장을 뒷받침해주는 각종 조사자료들이 있다. 2011년, 벤처캐피탈의 오픈소스 관련 업체들에 대한 투자 규모는 전년 대비 48% 증가한 6억 7,280만 달러를 기록하며 역대 최고치를 경신했다.

새로운 세계에서 혁신
대부분의 신형 빅 데이터 프레임워크와 데이터베이스는 오픈소스 환경에 그 근간을 두고 있다. 이 환경에서, 개발자들은 주류 시장에서 다뤄지지 않았던 새로운 문제 해결 방법론을 끊임없이 개발해내고 있다. 페이스북, 야후, 아마존, 트위터, 이베이와 같은 대형 온라인 커뮤니케이션 및 데이터 전송 서비스 공급자들은 혁신적인 오픈소스 개발을 지원하며 이를 이용하고 있다. 이제 오픈소스를 빼놓고는 빅 데이터의 가치와 성장을 논할 수 없게 됐다.

하둡은 빅 데이터 테크놀로지 시장의 견인차와 같은 존재다. 오늘날 빅 데이터 시장의 주된 트렌드는 오픈소스 아파치 하둡 플랫폼을 활용하는 방향으로 흘러가고 있으며, 클라우데라나 호튼웍스, 맵R(MapR)과 같은 업체들은 이를 지원하고 확장해 혁신을 주도하고 있기도 하다. 이들 업체들은 IBM이나 마이크로소프트와 같은 전통적인 대형 소프트웨어 업체들을 위협할 정도로 성장했다.


X