Offcanvas

BI / How To / 데이터센터 / 빅데이터 | 애널리틱스 / 애플리케이션

김진철의 How-to-Big Data | 빅데이터와 클라우드 기술 (3)

2017.12.06 김진철  |  CIO KR


빅데이터 인프라에서의 네트워크 인프라의 중요성 – 자원 계층 문제 해결 및 확장성 확보
현대 대부분 조직에서 운영하는 정보 시스템은 비즈니스 복잡성과 시장의 빠른 변화에 대응하기 위한 서비스-지향 아키텍처, 마이크로서비스 등의 최신 아키텍처를 도입하면서 점점 더 복잡한 분산 컴퓨팅 시스템으로 구성되고 있다. 빅데이터 비즈니스를 위한 정보 시스템은 빅데이터의 특성상 근본적으로 높은 요구사항의 분산 컴퓨팅 시스템이 될 수밖에 없다.

빅데이터를 기반으로 하는 비즈니스 정보 시스템을 구축할 때 하둡 등의 소프트웨어 도구에만 초점을 맞추게 되면서 많이 간과하는 부분중의 하나가 바로 네트워크 인프라 구축 문제이다. 이 문제는 사실 빅데이터 비즈니스를 하려는 조직이 빅데이터 비즈니스와 시스템에 대한 이해가 부족해서 생기는 측면도 있지만, 현대 대부분의 정보 시스템 구축 과정에서 네트워크는 전기와 같이 데이터센터에서 기본적으로 알아서 제공하는 인프라라고 생각하는 경우가 많기 때문이기도 하다. 최근에는 하둡, Spark 인프라 구축 경험이 쌓인 업체가 많아지면서 랙 간의 네트워크 구성을 팻트리 토폴로지(fat-tree topology) 형태로 대역폭을 늘이고, 빅데이터 연산의 특성에 맞게 랙 스위치 간 대역폭을 설계, 구축하는 것이 많이 정착되어 가고 있는 듯하다.



빅데이터 시스템 구축 시에는 사실 하둡과 같은 하나의 소프트웨어를 위한 네트워크 설계만으로는 충분하지 않다. 네트워크는 모든 IT 인프라를 묶어주는 역할을 하고, 일단 구축 후 증설이나 변경을 위해서는 많은 비용과 노력이 들며, 영향을 받는 시스템의 범위도 늘어나기 때문에 빅데이터 비즈니스 설계 초기부터 충분한 확장성을 고려하고 설계해야 한다. 필자가 빅데이터 비즈니스 인프라를 구축하기 위해서 가장 중요하게 먼저 해야 할 일이 비즈니스 모델을 분명히 하고, 비즈니스의 목적과 목표, 이에 따른 데이터 처리 과정과 데이터로부터 얻는 비즈니스 가치를 분명히 하고 시작해야 한다고 기고 초반에 거듭 강조한 바 있다. 빅데이터 비즈니스 인프라의 투자 위험을 줄이기 위해 들인 투자 초기의 꼼꼼하고 치밀한 계획과 노력은 빅데이터 네트워크 인프라 구축에서 더욱 빛을 발하게 된다.



빅데이터 처리를 위해 필요한 초당, 시간당 연산의 규모와 속도 요구사항에 따라 하둡, 스파크 등의 분산 컴퓨팅 소프트웨어 인프라를 구성하기 위한 컴퓨팅 노드 간, 랙 간, 그리고 클러스터 간 네트워크 대역폭과 지연 요구사항도 달라진다. 이 때문에 어느 정도의 빅데이터가 유입되고 처리되어야 비즈니스 수행에 문제가 없을지 충분한 사전 검토와 계획을 통해 요구사항을 추정하고 네트워크 설계와 확장 계획, 아키텍처를 잡아야 한다. 특히, 사용자 경험의 질과 품질이 중요한 대화형 인터페이스, AR/VR 등의 대용량 미디어와 사용자 빅데이터를 이용한 개인화된 사용자 경험을 제공하는 서비스의 경우에는 지연 요구사항을 면밀하게 검토해서 네트워크 인프라를 설계, 구축하는 것이 중요하다.

빅데이터 시스템의 네트워크를 설계, 구축할 때 세 가지 점을 염두에 두고 설계할 필요가 있다. 우선 빅데이터 시스템에서 고대역폭(high-bandwidth), 저지연(low-latency) 네트워크는 자원 계층을 허물어주는 역할을 한다. 자원 계층을 허문다는 말은 좀더 큰 규모의 계산, 저장장치 자원을 활용해 요구되는 지연 시간 내에 연산할 수 있도록 해준다는 말로, 비즈니스 요구사항을 만족하기 위해 처리에 필요한 단위시간당 자원의 규모에 따라 네트워크의 성능 수준이 결정되어야 한다는 말과 같다.

LHC 실험의 경우를 다시 한번 돌아보자. 검출기에서 초당 생산되는 데이터는 수 페타바이트 수준이지만, 검출기 설계 당시의 하드웨어 기술의 한계로 인해서 실제 수집되는 데이터는 1000분의 1인 수 테라바이트 수준이다. 이 원시 데이터를 검출기의 온라인 데이터 획득, 처리 분산 컴퓨팅 시스템에서 처리해서 Tier-0 데이터센터로 보내는데 추정된 데이터 대역폭은 초당 0.1 ~ 1.5기가바이트(GB) 정도였다. 이 초당 기가바이트 정도의 데이터 대역폭을 확보하기 위해 검출기 온라인 데이터 획득, 처리 시스템에서 CERN Tier-0 데이터센터까지의 네트워크 대역폭을 앞의 그림 2에서 본 것과 같이 데이터 생산량이 적은 LHCb 검출기는 40Gbps, 데이터 생산량이 많은 CMS 검출기는 120Gbps의 대역폭을 가지는 내부 데이터 전송망을 구축하였다.

LHC 실험 데이터 생산량이 2008년 실험 초반의 추정치였던 15페타바이트에서 2017년 73페타바이트까지 늘어나자, 이 빅데이터가 Tier-0 데이터센터에서 각 Tier-1 데이터센터로 분배되는데 필요한 대역폭이 10Gbps로는 부족하였다. 그래서, Tier-1데이터센터 중에서 자원 규모가 크고 핵심이 되는 Tier-1 데이터센터, 예를 들면 미국의 Brookhaven 국립 연구소와 Fermi 국립 연구소의 데이터센터로 연결되는 전송망의 데이터 대역폭을 100Gbps로 증설하였다. 이에 따른 대륙 간 대역폭 요구사항을 수용하기 위해 미국의 연구망인 ESNet과 유럽의 연구망인 GEANT는 대규모 네트워크 증설을 통해 보스턴-암스테르담, 뉴욕-런던, 워싱턴D.C-제네바 구간의 대역폭을 최대 340Gbps까지 확장하였다.

이렇게 ESNet, GEANT 등의 기반 연구망의 대역폭 확장과 검출기-Tier0 데이터센터 간 내부 네트워크 대역폭 확장을 통해 Tier-0 데이터센터와 Tier-1 데이터센터 간의 네트워크 병목으로 인한 자원 계층이 많이 완화되었다. 이는 LHC 컴퓨팅 그리드 자원의 수평적 확장성을 높여, 이전의 15페타바이트 처리가 가능했던 수준에서 이의 6배에 달하는 73페타바이트의 데이터를 전 세계 Tier-1 데이터센터에 분배하고 연산할 수 있게 하였다.

두 번째로 빅데이터 시스템에서 네트워크 구성은 데이터 처리 과정과 복잡도에 크게 영향을 받는다. 이 말은 빅데이터 시스템의 네트워크가 효과적으로 구성되기 위해서는 빅데이터 처리를 위한 요구사항이 파악되고, 요구사항에 맞는 데이터 처리 과정이 정의된 후에야 효과적인 네트워크 구성이 가능하다는 얘기다. 더군다나 빅데이터 시스템은 아무리 소규모의 시스템으로 구축해도 규모 있는 분산 컴퓨팅 시스템이 되기 때문에 네트워크 설계도 어느 수준 이상의 복잡도를 가지게 된다. 전체 데이터 가공 과정에 대한 분명한 큰 그림을 가지고, 분산 컴퓨팅으로 수행되는 연산과 데이터 교환의 특성, 데이터 가공 과정 간의 데이터 전송 요구사항에 대한 분명한 정의와 생각 없이 진행되는 빅데이터 시스템 네트워크 설계는 최적의 성능과 효과를 보장할 수 없다.

다시 LHC 실험의 경우를 돌아보자. CERN과 LHC 실험 공동 연구자들은 힉스 보존 및 입자 물리학 현상을 실험적으로 연구, 분석할 목적으로 LHC 가속기를 지으려고 했고, 데이터 분석을 위한 요구사항에 맞는 기술과 컴퓨팅 시스템을 설계하려다 보니 그리드 컴퓨팅 기술을 쓰게 된 것이다. LHC 가속기의 동작 파라미터를 통해 생성되는 데이터양을 추정하고, 이 데이터양을 분석을 위한 지연 시간 내에 처리, 전송, 보관하려다 보니 LHC 컴퓨팅 그리드의 계층 자원 구조를 고안하게 되었다. 이런 계층 자원 구조를 효과적으로 통합할 수 있는 네트워크를 만들기 위해 현재와 같은 LHC 컴퓨팅 그리드를 위한 고대역폭 연구망 인프라를 구축한 것이다. 애초부터 그리드 컴퓨팅을 위한 네트워크 기술이나 인프라를 먼저 만들려고 했던 것이 아니라, LHC 실험의 목적과 임무에 충실한 컴퓨팅 및 IT 시스템을 디자인하고 구현하기 위해 현재의 그리드 컴퓨팅 네트워크를 만들게 된 것이다.

사실 대부분의 정보 시스템 설계, 구축에서 이렇게 요구사항과 정보 시스템의 목적에 기초해서 네트워크를 비롯한 시스템을 설계하는 것은 기본적인 것이다. 하지만, 유독 빅데이터 시스템 구축에서는 데이터 분석과 특정 소프트웨어 도구가 유난히 부각되어서 그런지 기업의 전체 정보 시스템에서 빅데이터 시스템이 수행할 임무와 목적에 맞는 빅데이터 처리, 가공 요구사항에 맞는 네트워크 설계를 해야 한다는 이 원칙이 잘 부각되지 않는 듯하다.

이런 현상은 최근 주목받은 트렌드인 클라우드 컴퓨팅, 빅데이터에서 유독 심한 것 같다. 이는 클라우드 컴퓨팅, 빅데이터가 일반 기업 IT 관리자 및 실무자들에게 기업 IT의 고충 사항을 해결하는 기술로서 소개되지 않고 IT업체 및 솔루션 업체 주도로 기술이 도입된 측면도 있고, 그 개념과 범위가 초반에 정립되지 않고 말이 앞서는 트렌드 용어로서 먼저 자리 잡았기 때문으로 보인다.

마지막으로 빅데이터 시스템의 네트워크 설계를 위해 고려해야 할 점은 네트워크 가상화를 적절하게 활용해야 한다는 것이다. Tier0-Tier1 데이터센터 간 네트워크는 기간 네트워크망이라 어떤 장애와 데이터 전송량 증가에도 강건하게 버틸 수 있어야 하기 때문에 국제 협력으로 대규모의 증설과 성능 향상을 진행했지만, Tier1-Tier2 데이터센터 간 네트워크는 그렇게 하기에는 비용과 구축 노력이 너무 많이 들어간다. Tier-1-Tier2 데이터센터 간 네트워크는 Tier0-Tier1 데이터센터 간 네트워크보다는 상대적으로 데이터 전송량과 분배 빈도가 낮을 수 있기 때문에 백본 네트워크 자체를 근본적으로 업그레이드하기보다는 기존 망의 사용 효율을 높여서 데이터 전송 요구 사항을 맞추는 방법을 택했다.

Tier1-Tier2 데이터센터 간 기간 네트워크인 LHCONE에서 오버레이 네트워크 기술인 가상 라우팅 포워드(Virtual Routing and Forwarding; VRF)을 사용하여 기존의 연구망에서 Tier1-Tier2 구간 네트워크 라우팅과 전송 구간 대역폭을 효율화하여 운영한다. VRF기술을 효과적으로 활용하면 같은 IP를 쓰는 여러 라우팅 경로를 같은 라우터 장비 안에서 관리할 수 있어 일종의 멀티테넌트(multi-tenant) 네트워크 관리 기능을 구현할 수 있다. 이런 VRF를 이용해 다양한 Tier-1, Tier-2 데이터센터 간의 데이터 트래픽 경로가 효과적으로 대역폭과 라우팅 경로를 최적화할 수 있도록 관리할 수 있다.

현대의 클라우드 컴퓨팅 기술에서 가장 어려운 기술이 바로 네트워크 가상화 기술이다. 클라우드 컴퓨팅에서 네트워크 가상화 기술이 가장 필요했던 이유는 바로 멀티테넌시(multi-tenancy)를 지원하는 것이었다. 최근 2~3년간 클라우드 컴퓨팅 네트워크 인프라에서의 멀티테넌시를 지원하는 방법에 대해 가장 논란이 많았는데, VxLAN, NVGRE등의 터널링 프로토콜이 IP기반 멀티테넌시를 위한 새로운 대안 기술로 제안되기도 했다. 그렇지만 기존의 MPLS 프로토콜 같은 기술로도 멀티테넌시 지원이 가능하며, 최근 SDN과 함께 네트워크 가상화 기술로 주목받고 있는 네트워크 기능 가상화(Network Function Virtualization; NFV) 기술 측면에서도 쉽게 도입이 가능한 VRF 같은 기능을 이용하면 VxLAN 및 NVGRE등의 새로운 프로토콜을 사용하는 라우터를 사용하지 않더라도 멀티테넌시를 지원하는 네트워크 가상화가 가능하다.

네트워크 가상화를 적절하게 활용하여, 빅데이터 시스템을 위한 네트워크를 완전히 새로 구축하지 않고 기존의 네트워크 환경을 적절하게 활용해서 요구사항에 맞는 대역폭과 지연 제한을 확보할 수 있다면 그렇게 해야 할 것이다. 네트워크 가상화는 VxLAN, NVGRE 및 오픈플로우(OpenFlow) 등의 새로운 프토로콜을 사용하지 않더라도 요즘 점점 성능과 기술이 좋아지고 있는 NFV 기술을 적절히 활용하면 네트워크 장비의 가상화를 통해 지원할 수 있다. 기존의 사업 영역을 가지고 있는 조직이 빅데이터 기반의 신사업을 시도하려고 할 때 빅데이터 요구사항에 맞게 네트워크를 새롭게 구축하는 것과 함께 기존의 네트워크 환경을 네트워크 가상화 기술을 이용해 활용율을 높이는 것도 고려할 만하다.

빅데이터 비즈니스 인프라에서 네트워크 기술은 매우 중요하다. 빅데이터 문제를 해결하는 빅데이터 시스템에서 잘 구축된 네트워크 인프라는 빅데이터 시스템의 자원 계층 문제를 효과적으로 극복하여 전체 시스템의 성능을 높이고 비즈니스 민첩성을 강화하는데 큰 역할을 하게 된다. 빅데이터 시스템의 네트워크를 효과적으로 디자인, 구축하기 위해서는 데이터 수집 및 가공 과정에 대한 분명한 그림이 있어야 하며, 전체 데이터 수집 및 가공 과정이 잘 고려된 빅데이터 시스템의 네트워크는 시스템의 확장성과 성장을 효과적으로 포용할 수 있게 한다. 최근 발전하고 있는 네트워크 가상화 기술을 효과적으로 활용하면, 기존의 기업 IT 네트워크를 활용해서 빅데이터 요구 사항을 효과적으로 포용할 수 있다. 빅데이터 시스템에서 네트워크 인프라가 가지는 효과와 중요성 세 가지를 이와 같이 염두에 두고 시스템을 설계, 운영한다면 성장하는 빅데이터 비즈니스를 수행하면서 만나는 문제에 효과적으로 대처할 수 있을 것이다.

[참고문헌]
[1] 김진철, “LHC에서 배우는 빅데이터와 machine learning 활용 방안”, 2016년 9월 28일, A CIO Conversation for Technology Leadership – Breakfast Roundtable 발표 자료
[2] Ian Bird, “LHC Computing Grid Project: Status and Prospects,” China-CERN Workshop Beijing, 14th May 2005.
[3] 김진철, “Towards Singularity: Computing Technology Advances for Artificial Intelligence
- Trends in H/W, S/W and TensorFlow -,” 2017 Global Mobile Vision Conference, KINTEX, 2017.
[4] Sebastian Anthony, “The secret world of submarine cables, “ ExtremeTech, September 21, 2011 at 7:30 am. (https://goo.gl/82orXM)
[5] Tony Cass, “Network Connections for the Worldwide LHC Computing Grid,” December 11, 2014.
[6] Tony Cass, Edoardo Martelli, “WLCG Networking,” April 11, 2015.
[7] Ian Bird, “Worldwide Distributed Computing for the LHC,” April 3, 2017.
[8] The Energy Sciences Network – About ESNet, “The Network - A Nationwide Platform for Science Discovery.” (http://www.es.net/engineering-services/the-network/)
[9] GEANT – The Topology Map, https://www.geant.org/Resources/Documents/GEANT_topology_map_august2017.pdf .
[10] GEANT – The Global Connectivity, https://www.geant.org/Resources/Documents/1142%20Global%20Connectivity_2017_August-2017.pdf .

 

*김진철 박사는 1997년 한국과학기술원에서 물리학 학사, 1999년 포항공과대학교에서 인공신경망에 대한 연구로 석사 학위를, 2005년 레이저-플라즈마 가속기에 대한 연구로 박사 학위를 받았다. 2005년부터 유럽입자물리학연구소(CERN)의 LHC 데이터 그리드 구축, 개발에 참여, LHC 빅데이터 인프라를 위한 미들웨어 및 데이터 분석 기술을 연구하였다. 이후 한국과학기술정보연구원(KISTI), 포항공과대학교, 삼성SDS를 거쳐 2013년부터 SK텔레콤에서 클라우드 컴퓨팅과 인공지능 기술을 연구하고 있다. 빅데이터와 인공지능 기술의 기업 활용 방안에 대해 최근 다수의 초청 강연 및 컨설팅을 수행하였다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.