Offcanvas

AI / 비즈니스|경제 / 애플리케이션

앤트로픽, 클로드 3 하이쿠 모델 발표 “절반의 비용, 3배의 속도”

2024.03.15 Sandeep Budki  |  Computerworld
클로드 3 하이쿠(Claude 3 Haiku)는 기존 AI 모델보다 3배 더 빠르면서도 가장 저렴할 것이라고 회사는 주장했다.

앤트로픽이 저렴함과 ‘빠른 속도를 특징으로 하는 AI 모델인 클로드 3 하이쿠를 출시했다. 회사에 따르면 이 모델은 GPT 3.5보다 최대 절반의 비용으로 기존 모델보다 최대 3배 더 빠르게 작동한다. 한편 엔트로픽은 이로써 고급 버전인 클로드 3 오퍼스(Claude 3 Opus)와 클로드 3 소네트(Claude 3 Sonnet)에 이어 보급형 모델까지 확보하게 됐다.

토큰당 0.25달러의 입력 수수료와 1.25달러의 출력 수수료로 책정된 클로드 3 하이쿠는 앤트로픽에서 제공하는 비용 효율적인 AI 솔루션이다. 따라서 모든 규모의 기업이 이용할 수 있다고 회사는 블로그 게시물에서 밝혔다.

앤트로픽은 하이쿠가 저렴할 뿐만 아니라 효율적이라고 강조했다. 회사는 블로그 게시물에서 "기업은 하이쿠를 사용하여 분기별 서류, 계약서 또는 법적 소송과 같은 대량의 문서를 다른 성능 계층의 다른 모델에 비해 절반의 비용으로 신속하게 분석할 수 있다. 예를 들어 클로드 3 하이쿠는 단 1달러로 400건의 대법원 판례 또는 2,500개의 이미지를 처리하고 분석할 수 있다"라고 전했다.

공동 창립자이자 CEO인 다리오 아모데이는 벤처비트에게 하이쿠에 적합한 고객층에 대해 설명했다. 그에 따르면 회사는 크게 지연 시간에 민감한 고객과 비용에 민감한 고객으로 분류한다. 지연 시간에 민감한 고객은 일반적으로 원활한 사용자 인터페이스 보장 등 사용자 대면 측면을 우선시한다. 이들에게는 응답 시간이 3초만 되더라도 고객을 잃고 기업의 워크플로 효율성이 저하될 수 있다. 

AWS의 설명에 따르면 클로드 3 하이쿠가 적합한 몇몇 적용 사례가 있다. 먼저 번역 서비스를 포함하여 신속하고 정확한 지원을 제공하는 등 고객과의 상호 작용에 탁월하다는 설명이다. 또한 이 모델은 위험한 행동이나 고객 요청을 효과적으로 식별하고 관리하여 콘텐츠 중재에 유용하다는 것이 입증됐다고 포스트는 전했다. 뿐만 아니라 클로드 3 하이쿠는 물류를 최적화하고 재고 관리를 개선하며 비정형 데이터에서 신속한 지식 추출을 촉진하여 비용 절감에 기여한다는 설명이다.

앤트로픽은 클로드 3 하이쿠를 API 또는 클로드.ai의 클로드 프로 구독을 통해 제공하고 있다. 이 서비스는 이미 아마존 베드락에서 제공되고 있으며, 앤트로픽에 따르면 곧 구글 클라우드 버텍스 AI에서도 사용할 수 있게 될 예정이다.

사이버미디어 리서치의 산업 정보 그룹 책임자 프라부 람은 "생성형 AI 모델 분야가 현재 초고속 성장기를 맞이하고 있다. 클로드 3는 대규모 언어 모델(LLM) 시장에서 강력한 경쟁자다. 클로드 3의 경쟁력은 충분한 가드레일, 설명 가능성, 기업 고객 초점에 있다"라고 평했다.

3배 더 빨라진 클로드 3 하이쿠
앤트로픽은 하이쿠가 다른 모델보다 3배 더 빠르며, 3만 2,000 토큰 미만의 프롬프트에 대해 초당 2만 1,000개의 토큰을 처리한다고 주장했다. 

속도와 경제성 외에도 앤트로픽은 클로드 3 하이쿠에서 엔터프라이즈급 보안 조치를 강력하게 강조한다고 밝혔다. 엄격한 테스트 프로토콜을 구현하여 유해한 출력과 모델 위반의 위험을 최소화하고 데이터 무결성과 기밀성을 보장한다는 설명이다.

특히 지속적인 시스템 모니터링, 안전한 코딩 관행, 엄격한 액세스 제어는 하이쿠의 보안 프레임워크를 더욱 강화하여 앤서픽의 AI 솔루션에 민감한 데이터를 맡기는 기업들에게 신뢰를 심어준다고 회사는 강조했다.

비공개 데이터 세트에 대한 학습
하이쿠를 포함한 클로드 3 모델은 공개적으로 사용 가능한 인터넷 데이터와 비공개 소스를 혼합하여 학습한다. 중요한 점은 구독 여부와 관계없이 사용자가 생성한 데이터에 대해서는 학습을 수행하지 않는다는 점이다.

텍스트 이해력 외에도, 클로드 3 모델군은 복잡한 멀티모달 추론 문제를 처리하는 데 있어 상당한 진전을 보여준다.

블로그 게시물에 따르면, 이 모델은 이미지와 비디오 프레임 입력을 모두 통합하여 AI2D 과학 다이어그램 벤치마크와 같은 작업에서 탁월한 성능을 발휘한다. 특히 클로드 3 소네트는 0샷 설정에서 89.2%라는 인상적인 정확도로 선두를 차지했으며, 클로드 3 오퍼스(88.3%)와 클로드 3 하이쿠(80.6%)가 그 뒤를 뒤쫓고 있다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.