IT 업계에서는 더 비용 효율적인 프로세스를 설명할 때 '린(lean)'이라는 단어를 사용하는 것이 일반적인 관행처럼 보인다. 생성형 AI도 예외는 아니다. 잘 알려진 것처럼, 일부 기업이 실행하고자 하는 AI 시스템은 수백만 달러의 운영 비용이 들고 막대한 양의 전력을 소비한다. 많은 기업이 AI 아키텍트에게 더 효율적이고 간결한 솔루션을 요청하는 것은 당연한 일이다.
당연히 기업은 생성형 AI로 빠르게 전환할 수 있도록 퍼블릭 클라우드 서비스 업체를 찾는다. 퍼블릭 클라우드는 대시보드 버튼 하나만 누르면 완벽한 AI 생태계를 제공하기 때문이다. 실제로 대형 클라우드 서비스 업체들은 기업의 AI에 대한 초기 투자로 매출이 증가했다. 그러나 수많은 기업이 클라우드를 사용하면 데이터센터의 기존 시스템보다 운영 비용이 더 많이 들 수 있다는 사실을 알게 됐다. 그럼에도 불구하고 여전히 AI 활용의 중심은 클라우드에 있기 때문에 기업은 클라우드 비용을 더욱 효과적으로 사용할 수 있는 방법을 모색하고 있다. 바로 여기서 린 AI라는 개념이 등장한다.
린 AI의 접근 방식
린 AI는 비즈니스 가치를 극대화하면서 효율성, 비용 효과, 자원 소비 최소화를 강조하는 전략적 접근 방식이다. 많은 린 AI 방법론은 처음에 제조 및 제품 개발에 사용된 린 방법론에서 차용한 것이다.
린 AI는 AI 시스템의 개발, 배포 및 운영을 최적화하는 데 중점을 둔다. 소규모 모델, 반복적인 개발 프랙티스, 자원 효율화 기법을 사용해 낭비를 줄인다. 린 AI는 민첩한 데이터 기반 의사 결정과 지속적인 개선을 우선시함으로써 기업이 지속 가능하고 확장 가능한 방식으로 AI의 힘을 활용할 수 있도록 지원한다. 이를 통해 AI 이니셔티브가 영향력 있고 경제적으로 실현 가능하도록 보장한다.
오늘날 기업은 규모가 크다고 해서 반드시 좋은 것은 아니라는 사실을 깨닫고 있다. 기업용 AI의 지형 변화는 소규모 언어 모델(Small Language Model, SLM)과 오픈소스의 발전으로 특징지을 수 있다. 이런 진화는 LLM을 사용하는 생성형 AI 시스템에 따르는 막대한 비용과 자원에 대한 직접적인 대응이다. 이제 많은 기업이 비용과 비즈니스 가치 간의 균형을 재평가하고자 한다.
LLM의 과제와 SLM의 부상
오픈AI의 GPT-4나 메타의 라마 같은 대규모 언어 모델은 인간의 언어를 이해하고 생성하는 데 있어 탁월한 능력을 보여 왔다. 그러나 이런 강점에는 기업이 정당화하기 어려운 과제가 수반된다. LLM의 컴퓨팅 요구 사항과 그에 따른 클라우드 비용은 예산에 부담을 주고 광범위한 활용을 제한한다. 또한 전력 소비 문제도 있는데, 이는 재정적 부담은 물론 환경에도 심각한 영향을 미친다.
지연 시간은 특히 실시간 응답이 필요한 애플리케이션의 경우 또 다른 장애물이 된다. 또한 이런 LLM을 관리하고 유지 관리하는 데 따르는 복잡성도 간과해서는 안 되는데, 여기에 필요한 전문 지식과 인프라는 모든 기업이 쉽게 활용할 수 있는 것이 아니다.
이런 이유로 클라우드 및 비클라우드 환경에서 생성형 AI 배포를 위한 SLM 도입이 가속화되고 있다. SLM은 실용적인 대안으로 여겨지는데, 컴퓨팅 리소스 요구사항과 전력 소비 측면에서 훨씬 더 효율적으로 설계됐기 때문이다. 즉, 운영 비용이 절감되고 AI 이니셔티브에 대한 ROI가 높아진다. 또한 교육 및 배포 주기가 더 빠르기 때문에 시장 변화에 대한 민첩성과 대응력이 필요한 기업에 더 매력적인 해법이다.
기업은 일반적으로 LLM을 사용하지 않을 것이다. 대신 린 AI 접근 방식을 통해 즉각적인 비즈니스 가치를 창출할 수 있는 분야인 장비 유지보수, 운송 물류, 제조 최적화와 같은 특정 사용례를 해결하기 위해 보다 전술적으로 집중된 AI 시스템을 구축할 것이다.
SLM은 또한 맞춤 구현이 한층 더 정확해진다. 이런 모델은 특정 업무와 산업 영역에 맞게 세밀하게 조정할 수 있어 측정 가능한 비즈니스 성과를 창출하는 전문화된 애플리케이션을 만들어낼 수 있다. 고객 지원, 재무 분석, 의료 진단 등 어떤 분야에서든 이런 린 AI 모델은 그 효과를 입증할 수 있다.
오픈소스의 이점과 기업의 전략 변경
오픈소스 커뮤니티는 SLM의 발전과 도입의 원동력이다. 메타의 라마 3.1은 과도한 자원 요구 없이 강력한 기능을 제공하는 다양한 규모의 AI를 지원한다. 스탠포드의 알파카(Alpaca)와 스태빌리티 AI의 StableLM과 같은 모델은 특히 도메인별 애플리케이션에서 SLM의 성능이 LLM에 필적하거나 이를 능가한다는 것을 보여준다.
허깅 페이스, IBM의 왓슨x.ai 등의 클라우드 플랫폼과 도구는 이런 모델에 대한 접근성을 높이고 모든 규모의 기업이 이용할 수 있도록 진입 장벽을 낮추고 있다. 이런 AI 기능의 대중화는 업계의 판도를 바꾸고 있다. 더 많은 기업이 엄청나게 비싼 독점 솔루션에 의존하지 않고도 고급 AI를 도입할 수 있게 됐다.
기업 관점에서 SLM을 도입하면 얻을 수 있는 이점은 다양하다. SLM을 통해 기업은 비용 효율적으로 AI 배포를 확장할 수 있는데, 이는 기술 투자를 극대화해야 하는 스타트업과 중견 기업에 필수적인 고려 사항이다. 배포 시간이 단축되고 커스터마이징이 쉬워짐에 따라 AI 기능을 진화하는 비즈니스 요구사항에 더욱 밀접하게 맞출 수 있으므로 민첩성이 향상되어 실질적인 이점을 얻을 수 있다.
온프레미스 또는 프라이빗 클라우드 내에서 SLM을 호스팅하면 데이터 프라이버시 및 데이터 주권이라는 고질적인 문제를 더 쉽게 해결할 수 있다. 이 접근 방식은 강력한 보안을 유지하면서 규제 및 규정 준수 요건을 충족한다. 또한 SLM의 전력 소비량은 기업의 지속 가능성 이니셔티브도 지원한다.
오픈소스 혁신으로 강화된 SLM으로의 전환은 기업의 AI 접근 방식을 재편한다. SLM은 대규모 생성형 AI 시스템의 비용과 복잡성을 완화함으로써 실행 가능하고 효율적이며 맞춤형으로 발전할 수 있는 경로를 제공한다. 이런 변화는 AI 투자의 비즈니스 가치를 향상시키고 지속 가능하고 확장 가능한 성장을 지원한다. 지속 가능하고 합리적인 가격의 엔터프라이즈 AI를 통해 기업은 “작고 작은” 세상에서 살게 될 것이다.
editor@itworld.co.kr