Offcanvas

데브옵스 / 비즈니스|경제

‘닮은 듯 다른’ 월가 공룡들의 데브옵스 접근법

2022.06.03 Scott Carey  |  InfoWorld
두 금융 서비스 회사는 중앙집중식 운영 및 SRE 하에서 개발자 팀의 공유 책임 모델을 구축하는 등 데브옵스 전환에 유사한 접근 방식을 취하고 있다. 

‘뱅가드(Vanguard)’와 ‘모건 스탠리(Morgan Stanley)’는 대규모 클라우드 전환을 진행하면서 소프트웨어 개발과 운영의 균형을 신중하게 맞추고 있다.

지난 2015년 뱅가드는 자체적으로 관리하던 서버 2,000대를 대부분 AWS로 이동시키는 전환을 시작했다. 그 결과 7,000명의 개발자가 분기마다 단일 애플리케이션을 업데이트하던 것에서 개별 팀이 구축하고 실행하는 일련의 마이크로서비스로 이동했다. 이러한 팀은 이제 표준화된 CI/CD 파이프라인 그리고 코드를 적용할 수 있는 인프라를 제공하는 중앙 플랫폼 팀의 지원을 받으며, SRE는 이러한 팀 전체에 중앙집중식 및 임베디드식 감독 기능을 제공한다. 
 
ⓒGetty Images Bank

모건 스탠리는 2018년 애자일 및 클라우드 전환을 시작했으며, (이를 위해) 마이크로소프트 애저와 협력했다. 이 이니셔티브는 1만 5,000명에 달하는 해당 은행의 기술 전문가를 대상으로 최신 데브옵스 및 SRE 관행을 확립하기 위한 3개년 교육 프로젝트로 출발했다.

이는 모건 스탠리의 애플리케이션 인프라 부문 전무이사 거스 폴이 식별한 3가지 핵심 영역을 기반으로 한다. 그는 데브옵스 엔터프라이즈 서밋(Devops Enterprise Summit)에서 “3가지 핵심 영역은 소프트웨어 개발 및 제공 가속화, 변화의 예측 가능성/빈도/품질 증가, 기술 운영 혁신”이라고 말했다.

모건 스탠리의 데브옵스 및 엔터프라이즈 기술 아키텍처 책임자 트레버 브로스넌은 “현재 자사는 제품 소유자, 개발 및 운영 전문 지식을 갖춘 엔지니어로 구성된 애자일 팀을 보유하고 있으며, 이러한 팀은 온프레미스 또는 클라우드 인프라를 타깃으로 하고 있다. 개인적인 철학은 모두에게 전문 분야가 있는 것이다. 모두는 기술에 능통할 수 있다”라고 밝혔다.

뱅가드와 모건 스탠리처럼 크고 복잡하며 조심성 많은 기업이 안정된 빌드와 운영 방식을 바꾸는 것은 어려운 일이다. 하지만 뱅가드와 모건 스탠리는 수십억 또는 수조 달러를 관리하는 기업이 기대하는 통제 수준을 유지하는 것과 개발자에게 더 빠르게 움직일 수 있는 역량을 제공하는 것 사이에서 신중하게 균형을 맞추려는 시도를 멈추지 않았다. 

유연성과 위험 관리
뱅가드의 사이트 신뢰성 엔지니어이자 비즈니스 관련 개발자 팀을 지원하는 크리스티나 야코민은 표준화된 CI/CD 파이프라인, 클라우드 인프라 플랫폼 등의 ‘공유 서비스 플랫폼(shared service platforms)’을 운영하면서 특정 배포 제어를 설정하고 시행한다고 말했다. 

그에 따르면 이는 위험 회피 성향이 있는 금융 서비스 기업에 배포 단계에서 특정 제어가 시행되고 있다는 확신을 주는 동시에 서로 다른 개발팀 사이의 반복적인 작업을 없앤다. “이를 통해 이미 있는 것을 다시 만드느라 쓸데없이 시간을 낭비하지 않아도 된다”라고 야코민은 덧붙였다. 

아울러 야코민은 스포티파이(Spotify)의 ‘황금 경로(golden path)’ 플레이북에서 개발자가 따라갈 수 있는 ‘황금 경로’를 제공한다는 클라우드 네이티브 개념의 영향을 받았다고 언급했다. 그는 “이 업계에서 애플리케이션을 구축하는 데 필요한 제어가 매우 복잡하기 때문에 ‘표준 경로’를 만들면서 편차를 수용하도록 하고 있다”라고 설명했다.

하지만 엄격한 수준의 제어가 필요하기 때문에 야코민은 대부분의 개발자가 ‘황금 경로’를 고수하는 경향이 있다고 전했다. 팀이 새로운 기술이나 기법으로 탈바꿈하게 되면 즉시 책임을 지게 되기 때문이다.

한편 (유사한 구조를 갖춘) 모건 스탠리는 프로덕션 환경 배포 시의 위험 관리에 다른 접근 방식을 취하고 있다. 이전에는 개발자가 3개의 개별 지라(Jira) 인스턴스 사이에서 전환하고, 변경 티켓을 제출하며, (코드 한 줄이라도 승인하려면) 81단계를 거쳐야 했다. 지금은 최신 코드형 인프라와 CI/CD 관행을 도입해 해당 프로세스를 간소화하기 시작했으며, 중앙 팀은 다른 팀이 이를 따르도록 장려한다.

또 모건 스탠리는 각 변경 사항을 평가하고 위험 점수를 부여하는 자동화된 위험 계산기를 구축했다. 특정 임계치 미만의 변경 사항은 자동화된 파이프라인을 사용하여 배포할 수 있고, 임계치를 초과하는 것은 수동적인 승인 프로세스를 거치게 된다.

SRE라는 안전 장막
중앙 운영 수준과 개별 개발자 팀에 SRE을 적용하면서 뱅가드와 모건 스탠리는 개발자 속도와 운영 안정성 사이의 적절한 균형을 맞추고 있다는 신뢰를 쌓게 됐다. 하지만 이 기능은 다시 한번 문제를 분리하고, 개발과 운영 간의 연결을 끊을 가능성을 연다. 야코민은 “해결해야 할 미묘한 문제다. SRE를 도입하면 운영을 다시 해당 역할로 고립시킨다고 느끼게 된다”라고 지적했다.

모건 스탠리에서도 마찬가지로 SRE 원칙 수립이 “때때로 운영팀의 브랜드 변경으로 오해를 받는다”라고 브로스넌은 말했다. 

개발과 운영을 분리하는 대신, 뱅가드의 개발자와 운영 전문가가 보안 책임을 공유하고, 플랫폼을 공유하는 팀이 운영에 완전한 책임을 지도록 하고 싶다고 야코민은 전했다. 

뱅가드의 중개 기술 플랫폼 수석 책임자 로비 다이츠만은 “특정 플랫폼을 중심으로 중앙집중화하자는 슬로건을 만들어 이 문제를 극복할 수 있었다”라고 말했다. 이어 “중앙집중화는 인지 부하의 균형을 맞추고 공유 책임 모델을 구축하여 엔지니어에게 도움이 된다”라고 그는 덧붙였다. 

브로스넌은 “모건 스탠리에서도 SRE를 개발, 운영, 전체 개발 라이프사이클을 모두 아우르는 것으로 보고 있다. 예를 들면 수고스러운 일을 줄여주는 기본적인 SRE 관행은 일반적으로 운영 전문가가 가장 절실하게 필요할 것이다. 이때 개발자는 그러한 수고스러운 일을 자동화하는 데 적합하다. 또는 SRE의 핵심 요소인 신뢰성은 코어에서 탄력적으로 애플리케이션을 설계할 책임이 있는 개발자의 몫이다”라고 설명했다.

탄력적이고 관찰 가능한 시스템 구축하기
뱅가드의 중앙 SRE팀은 다양한 시스템이 탄력적이고 관찰 가능하도록 보장할 책임이 있다. 야코민과 다이츠만은 (뱅가드의) 카오스 엔지니어링 팀에서 근무한 적이 있다. 뱅가드의 새 시스템 회복탄력성을 검증하는 게 핵심이었다. 

아울러 이 회사는 핵심 시스템의 알림 전용 가시성에서 나아가 지표, 로그, 흔적을 수집하기 위해 아마존 클라우드워치(Amazon CloudWatch), 허니컴(Honeycomb)의 클라우드 네이티브 모니터링, 오픈 소스 오픈텔레메트리(OpenTelemetry) 표준을 채택했다.

다이츠만은 “SRE의 관찰 가능성은 엔지니어에게 삶의 질이 좋은 상태인지 아니면 고객에게 부정적인 영향을 미치고 있는지 파악하는 데 도움을 준다. 공유 책임 모델 안에서 결백을 주장하는 데도 도움을 준다”라고 전했다. 

이러한 관찰 가능성 지표 외에도 뱅가드는 자체적인 대시보드를 개발했으며, 해당 대시보드는 각 개발팀이 필요에 따라 수정할 수 있었다. 야코민은 “팀마다 원하는 것이 달랐다. 모든 것을 확보하려 했다면 비용이 엄청났을 것이다”라고 말했다.

적절한 균형 추구하기
많은 진전이 있었지만 야코민은 그의 팀이 여전히 효율성과 유연성 사이의 균형을 맞추고 있다고 말했다. 그의 계획은 모두가 새로운 공유 책임 모델로 전환하는 데 필요한 교육을 받고, 딜리버리 역량을 갖추며, 정확하고 흠잡을 데 없는 사후 검토를 하는 것으로 완료된다. 마지막으로 야코민은 개발자 팀이 안전하게 실험하고, 황금 경로에서 더 쉽게 벗어날 수 있도록 하고 싶다고 밝혔다. 

브로스넌은 “끝이 없다”라면서, “계속해서 이 커뮤니티의 모멘텀을 유지하는 데 집중하여 기업 문화의 영구적인 부분이 되도록 도울 것”이라고 전했다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.