과격한 혁명이 다가온다··· 소프트웨어 개발에 불어오는 AI 바람

CIO
뉴럴 네트워크(신경망)가 코드를 작성한다. 사람들은 주로 작업을 정의하고 데이터를 수집하며 사용자 인터페이스를 구현한다. 이미 이런 일을 벌어지는 시대다. 테슬라의 안드레이 카파시는 이를 ‘소프트웨어 2.0’의 시대로 부른다.

그러나 최소한 아직은 뉴럴 네트워크가 모든 작업을 처리할 수 있는 것은 아니다. 전통적인 소프트웨어 개발이 맡아야 할 역할이 여전히 남아 있기는 하다. 하지만 인공지능(AI), 머신러닝(ML), 고급 분석(Advanced analytics)이 소프트웨어 디자인, 작성, 테스트, 배포 방법을 바꾸고 있는 중이다.
 
ⓒ Image Credit : Getty Images Bank



테스팅
브라질 기업인 TOTVS는 약 10만에 달하는 엔터프라이즈 고객들에게 ‘미션 크리티컬’산업용 소프트웨어를 공급하고 있다. 금융 서비스 솔루션 같은 경우, 매일 수 조 달러의 거래가 처리된다.

이런 애플리케이션에는 적절한 테스팅이 필요하다. 테스트 케이스를 만드는 사람은 아주 세심히 테스트 시나리오를 디자인할 방법을 숙고해야 한다. 각각을 만드는 데 몇 시간이 걸린다.

TOTVS 랩스의 비센테 고텐 이규제큐티브 디렉터에 따르면, 계속 이렇게 작업하기란 아주 큰 도전 과제이다. 각 테스트 케이스를 사용자 인터페이스에 맞도록 맞춤화해야 한다. 애플리케이션은 끊임없이 다시 디자인되고, 인테페이스는 계속 변한다. 새 버전의 자바스크립트로 업데이트가 이뤄지면서 플랫폼 자체가 바뀐다면, 모든 디자인 요소가 한 번에 변한다.

고텐은 이와 관련, “수 만에 달하는 유즈 케이스를 다시 쓰는 것을 상상해보라!”라고 말했다.

TOTVS는 이 과제를 해결하기 위해 인공지능(AI)을 찾았다. TOTVS가 테스트에 사용하는 플랫폼인 펑셔널라이즈(Functionalize)는 이제 지능형 테스트 케이스 생성을 지원한다. 이 기술은 기반이 되는 코드에 의지하는 대신, 사람처럼 화면을 조사해 입력 필드와 버튼 등의 위치를 찾을 수 있다. 또 애플리케이션 스트레스 테스트를 하기 위한 표본 데이터 및 테스트 시나리오를 파악할 수 있다.

그는 “그 전에는 경력이 많은 QA가 우리가 사용하고 있던 레가시 솔루션에서 테스트 케이스를 완성하는 데 하루가 걸렸다. 지금은 몇 분 만에 동일한 테스트 케이스를 만들 수 있다”라고 설명했다.

최근에는 단순한 영어를 이해하는 기능이 추가됐다. 고텐은 “테스트 대상을 알려주면, 자동으로 테스트 케이스를 생성할 수 있다. 우리에게 완전히 새로운 문이 열린 것이다. 경력이 많은 QA가 테스트 케이스를 작성하는 횟수를 줄일 수 있게 되었다”라고 말했다.

모니터링 및 배포
소프트웨어가 QA를 통과해도, 의도한 것처럼 되지 않는 경우가 있다. 온라인 주거 개선(홈 임프루먼트) 소매업체인 빌드닷컴(Build.com)의 패트릭 베리 기술 담당 시니어 디렉터는 “오늘 아침을 예로 들면, 웹사이트가 처리를 할 준비가 되지 않은 제품 데이터가 들어왔다”라고 말했다.

빌드닷컴은 소프트웨어 성능 모니터링에 아주 많은 시간을 투자한다. 문제가 발생하면, 빌드닷컴은 소프트웨어를 이전의 정상 상태로 되돌린 후, 문제를 고치기 위해 개발자에게 보낸다.

베리는 “우리가 직면했던 문제는 작성한 소프트웨어가 지나치게 복잡해지고 트래픽이 증가함에 따라, 한 사람, 심지어 한 개 팀이 배포한 모든 모니터링 시스템을 조사해 ‘좋다’, ‘좋지 않으니 조치해야 한다’고 결정을 내리기 힘들어진 것이다. 너무 많은 시간을 낭비하게 만들었고, 릴리스를 늦췄다. 만족할 만한 빠른 속도로 고객 가치를 창출할 수 없었다. 또 제때 문제를 해결할 수 있도록 빠르게 개발자에게 피드백을 전달하지 못했다”라고 말했다.

빌드닷컴은 이에 ‘Software-delivery-as-a-service’ 플랫폼인 하네스(Harness)를 도입했다. 그리고 성능 모니터링에 투입하는 시간을 ‘0’에 가깝게 줄이고, 배포 속도는 20배 증가시킬 수 있었다. 지금은 문제가 발생했을 때, 시스템이 내장된 머신러닝 기능을 기반으로 자동으로 이전의 정상 상태로 복구한 후 문제를 보내 고친다. 빌드닷컴은 여기에 멈추지 않고, 코드 개발 프로세스에 AI를 더 많이 활용하는 방법을 찾고 있다.

그는 “아직 코드를 작성할 정도는 아니다. 그러나 AI와 ML이 개발 측면에서 도움을 줄 수 있는 분야가 있다. 공통적인 패턴들이 좋은지, 나쁜지 이해하는 것이다. 이상한 부분을 파악할 수 있다. 그러면 우리가 다시 돌아가 수정할 수 있다”라고 말했다.

보안
베리는 또 기업이 처음부터 더 나은, 그리고 더 안전한 코드를 만들 수 있도록 해주는 AI 도구들이 더 많이 등장하기 기대하고 있다.

그는 “문제 해결에 충분한 인력을 투입할 수 없는 분야를 보강하기 위해, 개발 측면에서 인공지능과 머신러닝을 활용할 방법을 찾고 있다는 의미이다. 코드 베이스에 수백 만 줄의 코드가 있다고 가정하자. 이 수백 만 줄의 코드를 감사하기 위해 얼마나 많은 인력을 투입하는가? 우리는 이를 처리할 수 있는 규모의 솔루션이 필요하다”라고 말했다.

예를 들어, 빌드닷컴은 기트허브를 코드 레포지토리(저장소)로 사용한다. “기트허브는 우리가 사용하는 써드파티 라이브러리의 코드를 모니터링하고, 잠재적인 취약점을 알려주는 시스템을 도입해 적용하고 있다”라고 베리는 말했다.

기트허브의 오모주 밀러 머신러닝 엔지니어에 따르면, 이는 기트허브에서 적극적으로 발전시키고 있는 부분이다. 그녀는 “공통된 취약점과 노출 발견 기능을 지원하는 모델을 만들고 있다”라고 말했다.

기트허브는 또 개발자가 실수로 코드에서 자신의 토큰을 공유한 지점을 찾는 데 도움을 주는 도구를 출시했다.

발견(디스커버리)
밀러에 따르면, 기트허브는 여기에 더해 개발자가 자연스럽게 함수(Functions)을 발견하도록 도움을 주는 도구를 개발하고 있다. 개발자는 AI를 이용하고 자신의 의도를 토대로 함수를 검색할 수 있다.

그녀는 “머신러닝 연구 팀은 기트허브의 오픈소스 코딩 플랫폼에 무수히 많은 공개 코드를 사용함으로써, 이를 구현 및 강화하는 데 큰 진전을 이뤘다. 개발자는 시멘틱 코드 검색을 이용, 자신의 컴퓨팅 문제 해결 니즈를 강화하고, 단순화시킬 수 있다”라고 말했다.

밀러는 개발자가 자신이 아는 것에만 제약을 받게 되지 않는다는 의미라고 덧붙였다. 밀러는 “자신의 문제 해결에 도움을 받기 위해, 기트허브에 저장된 코드에 대한 모든 지식을 활용할 수 있다”라고 설명했다.

분석
콘스텔레이션 리서치(Constellation Research)의 창업자 겸 수석 애널리스트인 레이 왕에 따르면, 정적 및 동적 소프트웨어 분석 도구에도 AI 기술이 도입되고 있는 중이다.

그는 “불과 18개월 전과 비교해도, 머신러닝 기능이 훨씬 더 ‘풍부’해진 상태이다. 뉴럴 네트워크도 적용되기 시작했다. 지금 당장은 동적 분석보다 정적 분석을 대상으로 하는 경우가 더 많다 그러나 향후 몇 년 이내에 AI에 기반을 둔 동적 분석이 부상할 것으로 내다본다”라고 말했다.

코드 개발
그러나 빌드닷컴의 베리에 따르면, 아무 것도 없는 상태에서 새 코드를 개발하는 경우 현재의 기술이 낫다. 그는 “현재 자신의 개발 환경을 통합하는 특정 시스템이 존재하지만, 내부에 구현된 탬플릿을 사용해 복사 및 붙여넣기 하는 방식에 가깝다”라고 지적했다.


단 조금씩 변하고 있다. 예를 들어, 가장 인기 있는 IDE 마이크로소프트 비쥬얼 스튜디오는 4월 최신 버전에서 AI의 도움을 받아 코드를 작성하는 기능이 추가되었다. 마이크로소프트의 비쥬얼 스튜디오 인텔리코드 시니어 프로그램 매니저인 마크 윌슨-토마스에 따르면, 이 기능은 수 천 오픈소스 기트허브 레포지토리를 대상으로 한 머신러닝에 토대를 두고 있다.

마이크로소프트의 비쥬얼 스튜디오 및 비쥬얼 스튜디오 코드 담당 프로그램 관리 파트너 디렉터인 아만다 실버는 “우리는 오픈소스 커뮤니티 코드에서 ‘지혜’를 추출한다. 이는 공통된 클래스 사용 방식에 대한 이해에 도움을 준다. 친숙하지 않은 코드를 작업할 때 특히 유용한 부분이다”라고 말했다.

최근 인텔리코드(IntelliCode) 사용자를 대상으로 한 조사 결과에 따르면, 기존 인텔리센스 대신 AI에 기반을 둔 인텔리코드를 사용했을 때 생산성이 높아진 것으로 판단된다고 대답한 비율이 70% 이상이었다.

기업은 이 도구를 사용함으로써 소속 직원들을 대상으로 맞춤형 프라이빗 모델도 만들 수 있다.그녀는 “이를 이용하면, 소스 코드를 마이크로소프트에 전송하지 않고도, 인텔리코드가 내부 팀이나 조직에 말을 하도록 만들 수 있다”라고 말했다.

가트너의 스베트라나 시큘라 애널리스트에 따르면, 마이크로소프트가 기트허브를 인수한 목적이 이런 기능 때문이었다.

마이크로소프트는 지난해, 1억 개의 레포지토리가 호스팅된 기트허브를 인수했다. 1억 개 중 오픈소스는 2,500만 개가 넘는다. 이 플랫폼은 공개 레포지토리, 또 소규모 프라이빗 프로젝트에 무료이다. 시큘라는 “기트허브는 코드 보관소이다. 개인적으로 마이크로소프트가 새 코드 생성에 이를 사용할 것으로 판단한다”라고 말했다.

스마트 애플리케이션 개발 플랫폼
빌드닷컴의 베리는 ‘로우 코드’ 및 ‘노 코드’ 분야에서 일어나고 있는 일도 주시하고 있는 중이다. 그는 “새로운 것은 아니다. 개발자는 개발이 이뤄지고 발전이 있는 경우 시스템을 통합해왔다”라고 말했다.

-> 개발자가 로우 코드 플랫폼을 믿지 말아야 할 때
-> '로우 코드' 개발로 혁신 가속화··· 4사의 사례
-> '약이 되거나 독이 되거나'··· '로우코드' 제대로 시작하기

최근에는 더 쉽고 빠르게 AI 기능성을 적용하고 배포할 수 있게 됐다. 그는 “예를 들어, 추천 엔진용 솔루션이 과거에는 아주 까다로운 맞춤형 솔루션이었지만, 지금은 ‘일상재(Commodities)이다”라고 설명했다.

그는 이어 “이는 우리에게 완전히 새롭고 우수한 혁신을 창출할 기회를 준다. 이 분야가 앞으로 우리에게 제공할 수 있게 될 것들을 크게 기대하고 있다”라고 덧붙였다.

멘딕스(Mendix)를 예로 들 수 있다. 이 회사는 약 10년 동안 애플리케이션 개발용 빌딩블록 시스템을 공급하고 있다. 개발자는 플랫폼에서 제공되는 옵션에서 기능을 통합한다. 그리고 이것이 충분하지 않은 경우, 빠진 부분을 위해 외부 코드를 연결한다. 현재 이 회사는 이런 모델을 분석하고, 프로덕션에서 행동(동작)을 조사해 가장 성공적인 행동(동작)을 찾고, 모델을 기반으로 패턴을 식별하는 딥러닝 시스템을 구현했다. 

하지만 아직은 IT 부서들이 이 플랫폼을 사용하기 주저하고 있다. 딜로이트 사이버(Deloitte Cyber)의 애플리케이션 보안 책임자인 비크람 쿤찰차에 따르면, 신뢰가 부족하다.

그는 “지금 이 시점에서는 궁금증과 호기심 차원에서 도입이 되고 있다. 기업은 작은 규모로 이 플랫폼을 테스트하고 있다. 또는 일부의 경우, 빠른 성과를 위해 도입한다. 그러나 내가 알고 있는 한, 이를 ‘엔터프라이즈 기준’으로 도입한 고객사는 없다”라고 말했다.

소프트웨어 2.0
그러나 가장 큰 도전과제는 전통적인 코드와 연결고리가 전혀 없는 애플리케이션으로 이동하는 것이다.

예를 들어 ‘틱택토’를 플레이하는 앱을 구축하기 원한다고 가정하자. 규칙과 게임 전략으로 프로그래밍을 할 수 있다. 게임 상대방이 이렇게 하면, 자신은 저렇게 한다. 개발자가 할 일은 올바른 전략을 선택하고, 매력적인 사용자 인터페이스를 만드는 것이다.

사람인 플레이어를 이기는 것이 목적인 경우, 이 전략은 틱택토, 체커, 심지어 체스에도 작동한다. 그러나 바둑 같이 더 어려운 게임의 경우, 규칙 집합을 만드는 것이 지나치게 어렵다. 그런데 딥 러닝과 뉴럴 네트워크 같은 AI 기술은 소프트웨어 프로세스를 뒤집을 수 있다.

개발자는 규칙을 출발점으로 삼지 않는다. 대신 수 많은 게임이라는 데이터로 시작한다. 알파고의 경우, 구글은 수 많은 기보를 통해 시스템을 훈련(트레이닝)시켰다. 최신 버전인 알파고 제로의 경우, 트레이닝 데이터는 시스템이 스스로를 상대로 플레이를 한 게임이었다(시작은 임의의 수).

트레이닝 데이터가 명확하고 양이 충분하며, 성공이나 실패에 대한 기준이 명확할 경우, 이런 방식은 소프트웨어 개발을 혁신할 잠재력을 갖는다. 개발자는 게임의 규칙을 파악해 코딩하는 대신, 트레이닝 데이터와 성공 기준을 관리하는 데 초점을 맞추고, 코딩은 시스템에 맡긴다.

테슬라의 안드레이 카파시 AI 디렉터에 따르면, 이는 테슬라가 자율 주행 자동차에 적용하고 있는 방식이기도 하다.

그는 지난해 한 기술 컨퍼런스에서 “이것이 완전히 새로운 소프트웨어 디자인 방식이다. 우리는 이제 코드를 쓰는 대신, 데이터 세트를 축적해 개선하고 있다. 이것이 사실상 코드이다”라고 말했다.

테슬라 차량의 앞 유리 와이퍼가 터널 안을 주행할 때 와이퍼를 켤 때, 끌 때를 제대로 알지 못한다고 가정하자. 기존 소프트웨어 개발의 경우, 프로그래머가 논리가 잘못된 부분을 찾기 위해 코드를 샅샅이 뒤져야 했다. 그렇지만 소프트웨어 2.0의 경우, 개발자는 데이터를 조사한다.

이 사례에서는 터널을 통과하는 차량에 대한 트레이닝 데이터가 충분하지 않아 발생한 문제였다.  테슬라는 더 많은 데이터를 수집해, 주석을 달고, 트레이닝 데이터 세트에 추가한 후, 딥러닝 알고리즘을 다시 실행했다. 카피시는 “이 방식으로 모든 문제에 접근할 수 있도록 만들었다”라고 말했다.

아직 전통적인 개발을 위한 공간도 남아 있다. 현재 이러한 시스템의 사용자 인터페이스, 다른 플랫폼과의 통합은 수동으로 처리된다. 그러나 많은 데이터를 사용할 수 있는 애플리케이션과 로우 코드 플랫폼에 AI를 활용하는 기업이 증가하면, 소프트웨어 개발 방식이 가까운 장래에 크게 혁신될 것으로 관측된다. ciokr@idg.co.kr