2018.05.08

"서버 비용 80% 절감"··· 파이낸셜 타임즈의 쿠버네티스 도입기

Charlotte Jee | Computerworld UK
영국 파이낸셜 타임즈(FT)의 콘텐츠 플랫폼 팀이 도커 (Docker) 콘테이너를 도입함으로써 AWS 서버 비용을 80% 줄이고 인프라스트럭처 안정성을 대폭 향상시켰다. 그러나 이러한 성과는 거저 얻어지지 않았다.

FT는 도커 기술의 얼리 어답터에 해당한다. 이 컨테이너 플랫폼을 도입한 시기가 2015년 중반기이기 때문이다. 지난주 덴마크 코펜하겐에서 열린 쿠베콘(KubeCon)에서 FT의 운영 및 안정성 부문 기술 디렉터 사라 웰스는 "당시만 해도 도커는 꽤나 최첨단 기술이었다. 각종 요소를 결합하기 위해 큰 노력을 기울여야 했다"라고 말했다.



혁신 토큰
웰스는 먼저 인프라스트럭처 '변화'를 시도함에 있어 한번에 도입할 수 있는 한계값이 있다고 지적했다. 그리고 이를 감안해 현명하게 사용해야 하는 한정된 수의 '혁신 토큰' 개념을 조직이 검토해보라고 제안했다.

예를 들어 FT의 기술 팀은 초창기 자체 콘테이너 오케스트레이션 플랫폼을 개발해야 했다. 당시에는 기성품 솔루션이 없었기 때문이다. 웰스는 "이는 혁신 토큰을 지출해야 하는 것을 의미했다"라고 말했다.

기술 팀은 2017년 콘테이너 오케스트레이션 플랫폼인 쿠버네티스를 도입해 기존 콘테이터화된 150여 개의 기술 스택을 관리했다. 이 아키텍처의 도입은 릴리즈 수를 연간 12건에서 2,200건으로 늘릴 수 있게 해줬다.

이러한 시도는 비용 절감으로 이어졌다. 웰스는 "전체 스택을 8개의 대형 VM으로 이동함으로써 80%의 비용 절감 효과를 거둘 수 있었다"라고 말했다.

웰스는 그러나 쿠버네티스로의 전향이 시도하기에 그리 작은 작업은 아니었다고 덧붙였다. 비록 혜택이 위험을 초과해 시도하기는 했지만, 지원 가능성 및 문서화와 관련해 여러 문제점이 있었다는 설명이다.

웰스는 "먼저 도움을 요청할 만한 곳이 없었다. 또 콘테이너 작업을 수행한 이들 중 상당수가 2016년 회사를 떠났다"라고 말했다.

지루한 기술
FT의 기술 팀이 기성 플랫폼의 장점에 주목한 이유가 여기에 있었다. 웰스는 이를 '지루한 기술'이라고 표현했다.

그녀는 "기술은 대개 전문가가 커스텀 빌드를 하며 시작한다. 이후 제품으로 만들어져 상품이 된다 전기를 예로 들어보자. 전기를 쓰려고 발전소를 건설하는 이는 드물다. 단지 연결만 할 뿐이다. 컴퓨터도 마찬가지다. 데이터센터에서 프라이빗 클라우드로, 다시 퍼블릭 클라우드로 옮겼다"라고 말했다.

웰스는 이어 "발전소를 건설하기보다는 연결만 하는 작업이 지루한 기술로 보일 수 있다. 그러나 이는 나쁘지 않다. 기술 팀이 진정한 차별화 역량에 초점을 맞출 수 있게 한다. 새롭고 혁신적인 기술을 개발하는 것은 멋지지만 비즈니스 혜택은 다른 이야기다. 우리는 클러스터 오케스트레이션 기업이 아니다. 우리는 뉴스 비즈니스를 펼치고 있다"라고 말했다.

팀은 두 가지 이유로 쿠버네티스를 선택했다. 먼저 오픈소스이기에 문서 공유 및 정보 고유 측면에서 장점이 있었다. 또 검증된 기술이자 업계에서 새롭게 부상하는 표준 격의 기술이라는 사실도 선택 이유였다.

마이그레이션 문제
쿠버네티스를 채택하면서 발생한 주요한 과제는 자체 플랫폼으로부터 쿠버네티스로의 이동이 동시에 병렬적으로 이뤄져야 한다는 것이었다.

웰스는 "그것은 큰 도전이었다. 그것은 거센 강을 도강하면서 말을 바꿔타는 것과 같았다"라며 "마이그레이션이 시작될 때 150건의 서비스가 새롭게 생겨 났고 다른 많은 일들이 진행되고 있었다. 우리는 그 중 하나에 영향을 미치지 않고 마이그레이션해야 했다"라고 말했다.

이로 인해 AWS 비용 및 로깅 도구가 일시적으로 증가했으며 이는 시간과 비용의 지출 증가로 이어졌다. 또 스택 두 개를 동기화 상태로 유지하고 양쪽에 변경 사항을 적용하고 두 플랫폼에서 모든 것을 두 번 테스트하는 작업의 난이도가 높았다.

웰스는 "그러나 마이그레이션이 원활하게 진행됐으며 플랫폼의 안정성이 개선됐다. 3건의 사고 발생했지만 비즈니스에 영향을 끼지지 않았다"라며, "결과적으로 기존 플랫폼을 지원하는 것보다 훨씬 안정적이고 저렴한 시스템을 확보할 수 있게 됐다. 또 단순 기능 업무를 수행하는 것보다 더 행복한 기술 팀을 보유할 수 있게 됐다"라고 말했다. ciokr@idgc.co.kr 



2018.05.08

"서버 비용 80% 절감"··· 파이낸셜 타임즈의 쿠버네티스 도입기

Charlotte Jee | Computerworld UK
영국 파이낸셜 타임즈(FT)의 콘텐츠 플랫폼 팀이 도커 (Docker) 콘테이너를 도입함으로써 AWS 서버 비용을 80% 줄이고 인프라스트럭처 안정성을 대폭 향상시켰다. 그러나 이러한 성과는 거저 얻어지지 않았다.

FT는 도커 기술의 얼리 어답터에 해당한다. 이 컨테이너 플랫폼을 도입한 시기가 2015년 중반기이기 때문이다. 지난주 덴마크 코펜하겐에서 열린 쿠베콘(KubeCon)에서 FT의 운영 및 안정성 부문 기술 디렉터 사라 웰스는 "당시만 해도 도커는 꽤나 최첨단 기술이었다. 각종 요소를 결합하기 위해 큰 노력을 기울여야 했다"라고 말했다.



혁신 토큰
웰스는 먼저 인프라스트럭처 '변화'를 시도함에 있어 한번에 도입할 수 있는 한계값이 있다고 지적했다. 그리고 이를 감안해 현명하게 사용해야 하는 한정된 수의 '혁신 토큰' 개념을 조직이 검토해보라고 제안했다.

예를 들어 FT의 기술 팀은 초창기 자체 콘테이너 오케스트레이션 플랫폼을 개발해야 했다. 당시에는 기성품 솔루션이 없었기 때문이다. 웰스는 "이는 혁신 토큰을 지출해야 하는 것을 의미했다"라고 말했다.

기술 팀은 2017년 콘테이너 오케스트레이션 플랫폼인 쿠버네티스를 도입해 기존 콘테이터화된 150여 개의 기술 스택을 관리했다. 이 아키텍처의 도입은 릴리즈 수를 연간 12건에서 2,200건으로 늘릴 수 있게 해줬다.

이러한 시도는 비용 절감으로 이어졌다. 웰스는 "전체 스택을 8개의 대형 VM으로 이동함으로써 80%의 비용 절감 효과를 거둘 수 있었다"라고 말했다.

웰스는 그러나 쿠버네티스로의 전향이 시도하기에 그리 작은 작업은 아니었다고 덧붙였다. 비록 혜택이 위험을 초과해 시도하기는 했지만, 지원 가능성 및 문서화와 관련해 여러 문제점이 있었다는 설명이다.

웰스는 "먼저 도움을 요청할 만한 곳이 없었다. 또 콘테이너 작업을 수행한 이들 중 상당수가 2016년 회사를 떠났다"라고 말했다.

지루한 기술
FT의 기술 팀이 기성 플랫폼의 장점에 주목한 이유가 여기에 있었다. 웰스는 이를 '지루한 기술'이라고 표현했다.

그녀는 "기술은 대개 전문가가 커스텀 빌드를 하며 시작한다. 이후 제품으로 만들어져 상품이 된다 전기를 예로 들어보자. 전기를 쓰려고 발전소를 건설하는 이는 드물다. 단지 연결만 할 뿐이다. 컴퓨터도 마찬가지다. 데이터센터에서 프라이빗 클라우드로, 다시 퍼블릭 클라우드로 옮겼다"라고 말했다.

웰스는 이어 "발전소를 건설하기보다는 연결만 하는 작업이 지루한 기술로 보일 수 있다. 그러나 이는 나쁘지 않다. 기술 팀이 진정한 차별화 역량에 초점을 맞출 수 있게 한다. 새롭고 혁신적인 기술을 개발하는 것은 멋지지만 비즈니스 혜택은 다른 이야기다. 우리는 클러스터 오케스트레이션 기업이 아니다. 우리는 뉴스 비즈니스를 펼치고 있다"라고 말했다.

팀은 두 가지 이유로 쿠버네티스를 선택했다. 먼저 오픈소스이기에 문서 공유 및 정보 고유 측면에서 장점이 있었다. 또 검증된 기술이자 업계에서 새롭게 부상하는 표준 격의 기술이라는 사실도 선택 이유였다.

마이그레이션 문제
쿠버네티스를 채택하면서 발생한 주요한 과제는 자체 플랫폼으로부터 쿠버네티스로의 이동이 동시에 병렬적으로 이뤄져야 한다는 것이었다.

웰스는 "그것은 큰 도전이었다. 그것은 거센 강을 도강하면서 말을 바꿔타는 것과 같았다"라며 "마이그레이션이 시작될 때 150건의 서비스가 새롭게 생겨 났고 다른 많은 일들이 진행되고 있었다. 우리는 그 중 하나에 영향을 미치지 않고 마이그레이션해야 했다"라고 말했다.

이로 인해 AWS 비용 및 로깅 도구가 일시적으로 증가했으며 이는 시간과 비용의 지출 증가로 이어졌다. 또 스택 두 개를 동기화 상태로 유지하고 양쪽에 변경 사항을 적용하고 두 플랫폼에서 모든 것을 두 번 테스트하는 작업의 난이도가 높았다.

웰스는 "그러나 마이그레이션이 원활하게 진행됐으며 플랫폼의 안정성이 개선됐다. 3건의 사고 발생했지만 비즈니스에 영향을 끼지지 않았다"라며, "결과적으로 기존 플랫폼을 지원하는 것보다 훨씬 안정적이고 저렴한 시스템을 확보할 수 있게 됐다. 또 단순 기능 업무를 수행하는 것보다 더 행복한 기술 팀을 보유할 수 있게 됐다"라고 말했다. ciokr@idgc.co.kr 

X