Offcanvas

AI / How To / 개발자 / 오픈소스

메타, 초보자를 위한 '라마 2 사용법 5단계' 소개

2023.11.17 김달훈  |  CIO KR
메타(Meta)가 2023년 7월 대규모 언어 모델(LLM;Large Language Models) '라마(LIama) 2'를 공개했다. 라마 2는 누구나 무료로 사용할 수 있으면서, 소스 코드가 공개된 오픈소스라는 것이 큰 장점이다. 생성형 AI의 열풍에 불을 지핀 오픈AI의 챗GPT나 구글의 바드(Bard)가 폐쇄적인 정책을 선택한 것과 다르게, 라마 2는 누구나 연구나 상업적 용도로 사용하고 그 과정에서 생긴 리소스를 공유할 수 있다.

메타가 이러한 라마 2를 많은 사람들이 빠르고 쉽게 접하고 사용할 수 있도록, '라마 2를 시작하는 5단계(5 Steps to Getting Started with Llama 2)'라는 초보자용 가이드를 공개했다. 파이썬(Python) 설치, 모델 가중치 다운로드, 파이썬 스크립트 작성, 모델 실행, 리소스 및 추가 자료로 구성되어 있으며, 블로그를 방문하면 각각의 단계를 따라가며 자세한 사용법을 익힐 수 있다.


'라마 2를 시작하는 5단계' 가이드는 파이썬 다운로드와 설치부터 시작해, 모델 가중치 다운로드, 파이썬 스크립트 작성 등의 과정으로 진행한다. 웹페이지를 방문하면 자세한 단계별 가이드를 확인할 수 있다. (자료 : Meta)

첫 번째는 자신이 사용하는 컴퓨터 운영 체제에 맞는 파이썬을 다운로드받아 설치해야 한다. 파이썬은 프로그래밍 언어로 라마 2는 파이썬으로 코드를 작성하고 이를 통해 원하는 작업을 수행하게 된다. 라마 2를 사용하기 위해서는 먼저 파이썬 웹사이트를 방문한 후 윈도, 리눅스/유닉스, 맥OS 등 운영체제에 맞는 파이썬을 다운로드해서 설치한다.

두 번째는 깃허브(Github) 저장소에서 모델을 다운로드하는 과정이다. 메타의 AI 사이트를 방문해서 라이선스에 동의하는 양식을 먼저 제출하면, URL이 포함된 요청 승인 메일을 받게 된다. 그런 다음 다운로드 스크립을 실행해서 깃허브에 있는 라마 2 저장소로부터 모델을 다운로드한다. 이때 입력할 스크립트나 명령어는 앞에서 언급한 가이드 페이지를 방문하면 자세하게 확인할 수 있다.

세 번째는 모델을 로드하고 변환기를 사용하여, 추론을 실행하는 데 필요한 모든 코드를 포함한 파이썬 스크립트를 작성할 차례다. 한 마디로 파이썬으로 프로그래밍을 하는 단계인 만큼, 파이썬 코딩에 대한 기본적인 지식이 있다면 수월하게 진행할 수 있다. 스크립트는 필요한 모듈 가져오기, 모듈 로드, 토크나이저 및 파이프라인 정의와 인스턴스화, 파이프라인 실행 등의 순서로 작성한다.

네 번째는 앞에서 작성한 파이썬 스크립트를 실행하는 과정이다. 작성한 스크립트를 저장하고, 콘다(Conda) 가상 환경으로 돌아간다. 앞에서 작성한 파이썬 스크립트를 실행하며 모델을 다운로드하고 스크립트를 실행한 후에, 생성된 질문 및 답변과 함께 파이프라인의 단계별 진행 상황을 보여준다. 작업이 완료되면 라마 2를 로컬 컴퓨터에서 설정하고 실행할 수 있다.

다섯 번째는 다양한 리소스와 추가적인 자료를 탐색하고 이를 적용하는 단계다. 라마 2의 작동 방식, 훈련 방법, 사용된 하드웨어에서부터 모델 아키텍처, 용도, 하드웨어와 소프트웨어 요구 사항, 교육 데이터 등 모델에 대한 상세한 자료를 구할 수 있다. 아울러 미세 조정을 빠르게 시작하는 방법과 미세 조정 모델에 대한 추론 실행 예제도 깃허브에서 제공하며, 코딩용 AI 도구인 코드 라마도 사용할 수 있다.

라마 2는 70억 개에서 최대 700억 개의 매개변수 범위에서 사전에 훈련되고 미세 조정된 대규모 언어 모델을 위한 가중치와 시작 코드를 포함하고 있다. 라마 1과 비교할 때 라마 2는 40% 더 많은 데이터를 학습하고, 콘텍스트는 2배가 많다. 그만큼 더 많이 공부했고, 그래서 더 똑똑하고 자연스러운 결과를 보여준다.

라마 2를 로컬 컴퓨터에서 설정해서 사용하는 방법은 여러 가지가 있다. 앞에서 소개한 것은 메타가 초보자들이 가장 쉽게 접근할 수 있도록 제시한 기본적인 단계와 방법이다. 오픈소스 대규모 언어 모델이 제공하는 자유로운 사용과 폭넓은 확장성을 경험할 수 있는 만큼, 챗GPT나 바드(Bard) 등의 생성형 AI의 텍스트 프롬프트의 제한에서 벗어나고 싶다면, 자유롭게 도전해 볼만한 가치가 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.