"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Ollama 및 LangChain을 사용하여 로컬 RAG 에이전트를 만드는 방법

Ollama 및 LangChain을 사용하여 로컬 RAG 에이전트를 만드는 방법

2024-08-14에 게시됨
검색:367

How to Create a Local RAG Agent with Ollama and LangChain

RAG란 무엇입니까?

RAG는 검색 증강 생성의 약자로, 문서 형식으로 구체적이고 관련성 높은 컨텍스트를 제공하여 대규모 언어 모델(LLM)의 성능을 향상시키도록 설계된 강력한 기술입니다. 사전 훈련된 지식만을 기반으로 응답을 생성하는 기존 LLM과 달리 RAG를 사용하면 실시간 데이터 또는 도메인별 정보를 검색하고 활용하여 모델의 출력을 원하는 결과에 더욱 밀접하게 맞출 수 있습니다.

RAG 대 미세 조정

RAG와 미세 조정 모두 LLM의 성능 향상을 목표로 하지만 RAG가 더 효율적이고 리소스 친화적인 방법인 경우가 많습니다. 미세 조정에는 상당한 계산 리소스, 시간 및 전문 지식이 필요한 특수 데이터 세트에 대한 모델 재교육이 포함됩니다. 반면 RAG는 관련 정보를 동적으로 검색하여 생성 프로세스에 통합하므로 광범위한 재교육 없이도 새로운 작업에 보다 유연하고 비용 효과적으로 적응할 수 있습니다.

RAG 에이전트 구축

요구 사항 설치

올라마 설치

Ollama는 LLaMA를 로컬에서 실행하는 데 필요한 백엔드 인프라를 제공합니다. 시작하려면 Ollama 웹사이트로 이동하여 애플리케이션을 다운로드하세요. 지침에 따라 로컬 컴퓨터에 설정하세요.

LangChain 요구 사항 설치

LangChain은 다양한 LLM 및 벡터 데이터베이스와 함께 작동하도록 설계된 Python 프레임워크로, RAG 에이전트 구축에 이상적입니다. 다음 명령을 실행하여 LangChain과 해당 종속성을 설치합니다:

pip install langchain

RAG 에이전트 코딩

API 함수 생성

먼저 로컬 LLaMA 인스턴스와 상호작용하는 함수가 필요합니다. 설정 방법은 다음과 같습니다.

from requests import post as rpost

def call_llama(prompt):
    headers = {"Content-Type": "application/json"}
    payload = {
        "model": "llama3.1",
        "prompt": prompt,
        "stream": False,
    }

    response = rpost(
        "http://localhost:11434/api/generate",
        headers=headers,
        json=payload
    )
    return response.json()["response"]

LangChain LLM 만들기

다음으로, 이 기능을 LangChain 내의 맞춤형 LLM 클래스에 통합하세요:

from langchain_core.language_models.llms import LLM

class LLaMa(LLM):
    def _call(self, prompt, **kwargs):
        return call_llama(prompt)

    @property
    def _llm_type(self):
        return "llama-3.1-8b"

RAG 에이전트 통합

리트리버 설정

검색자는 사용자의 쿼리를 기반으로 관련 문서를 가져오는 역할을 담당합니다. 벡터 저장을 위한 FAISS와 HuggingFace의 사전 훈련된 임베딩을 사용하여 설정하는 방법은 다음과 같습니다.

from langchain.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings

documents = [
    {"content": "What is your return policy? ..."},
    {"content": "How long does shipping take? ..."},
    # Add more documents as needed
]

texts = [doc["content"] for doc in documents]

retriever = FAISS.from_texts(
    texts,
    HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
).as_retriever(k=5)

프롬프트 템플릿 생성

RAG 에이전트가 검색된 문서를 기반으로 응답을 생성하는 데 사용할 프롬프트 템플릿을 정의합니다.

from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder

faq_template = """
You are a chat agent for my E-Commerce Company. As a chat agent, it is your duty to help the human with their inquiry and make them a happy customer.

Help them, using the following context:

{context}

"""

faq_prompt = ChatPromptTemplate.from_messages([
    ("system", faq_template),
    MessagesPlaceholder("messages")
])

문서 및 검색기 체인 생성

문서 검색과 LLaMA 생성을 응집력 있는 체인으로 결합합니다.

from langchain.chains.combine_documents import create_stuff_documents_chain

document_chain = create_stuff_documents_chain(LLaMa(), faq_prompt)

def parse_retriever_input(params):
    return params["messages"][-1].content

retrieval_chain = RunnablePassthrough.assign(
    context=parse_retriever_input | retriever
).assign(answer=document_chain)

Ollama 서버 시작

RAG 에이전트를 실행하기 전에 Ollama 서버가 실행 중인지 확인하세요. 다음 명령을 사용하여 서버를 시작하십시오:

ollama serve

RAG 에이전트에 메시지 표시

이제 다음 쿼리를 보내 RAG 에이전트를 테스트할 수 있습니다.

from langchain.schema import HumanMessage

response = retrieval_chain.invoke({
    "messages": [
        HumanMessage("I received a damaged item. I want my money back.")
    ]
})

print(response)

응답:
"손상된 상품을 받으셨다니 정말 안타깝습니다. 당사 정책에 따라 손상된 상품을 받으신 경우 즉시 고객 서비스 팀에 파손 사진과 함께 연락해 주시기 바랍니다. 교환 또는 환불을 준비해 드리겠습니다. 환불을 받으시려면 주문 번호, 손상된 품목에 대한 세부정보 등 몇 가지 정보가 필요합니다. 요청을 처리하는 데 도움을 드릴 수 있나요?"


이 단계를 수행하면 실시간 컨텍스트를 통해 LLM의 성능을 향상시킬 수 있는 완전한 기능을 갖춘 로컬 RAG 에이전트를 만들 수 있습니다. 이 설정은 다양한 도메인과 작업에 적용할 수 있으므로 상황 인식 생성이 중요한 모든 애플리케이션에 적합한 다목적 솔루션입니다.

릴리스 선언문 이 기사는 https://dev.to/dmuraco3/how-to-create-a-local-rag-agent-with-ollama-and-langchain-1m9a?1에서 복제됩니다.1 침해가 있는 경우, Study_golang에 문의하세요. @163.com 삭제
최신 튜토리얼 더>
  • 제로에서 웹 개발자로 전환: PHP의 기초 익히기
    제로에서 웹 개발자로 전환: PHP의 기초 익히기
    PHP의 기본을 마스터하는 것은 필수입니다. PHP 설치 PHP 파일 만들기 코드 실행 변수 및 데이터 유형 이해 표현식 및 연산자 사용 기술 향상을 위한 실제 프로젝트 만들기 PHP 개발 시작하기: PHP 기본 익히기PHP는 동적 및 대화형 웹 애플리케이션을 만들...
    프로그램 작성 2024-11-05에 게시됨
  • 버퍼: Node.js
    버퍼: Node.js
    Node.js의 버퍼에 대한 간단한 가이드 Node.js의 버퍼는 원시 바이너리 데이터를 처리하는 데 사용되며, 이는 스트림, 파일 또는 네트워크 데이터로 작업할 때 유용합니다. 버퍼를 만드는 방법 문자열에서: const buf = ...
    프로그램 작성 2024-11-05에 게시됨
  • Node.js의 버전 관리 마스터하기
    Node.js의 버전 관리 마스터하기
    개발자로서 우리는 다양한 Node.js 버전을 요구하는 프로젝트를 자주 접하게 됩니다. 이 시나리오는 Node.js 프로젝트에 정기적으로 참여하지 않는 신규 개발자와 숙련된 개발자 모두에게 함정입니다. 즉, 각 프로젝트에 올바른 Node.js 버전이 사용되는지 확인하는...
    프로그램 작성 2024-11-05에 게시됨
  • 문제 해결을 위해 Go 바이너리에 Git 개정 정보를 포함하는 방법은 무엇입니까?
    문제 해결을 위해 Go 바이너리에 Git 개정 정보를 포함하는 방법은 무엇입니까?
    Go 바이너리에서 Git 개정 확인코드를 배포할 때 바이너리를 빌드된 Git 개정과 연결하는 것이 도움이 될 수 있습니다. 문제 해결 목적. 그러나 개정 번호로 소스 코드를 직접 업데이트하는 것은 소스를 변경하므로 불가능합니다.해결책: 빌드 플래그 활용이 문제에 대한 ...
    프로그램 작성 2024-11-05에 게시됨
  • 일반적인 HTML 태그: 관점
    일반적인 HTML 태그: 관점
    HTML(HyperText Markup Language)은 웹 개발의 기초를 형성하며 인터넷의 모든 웹페이지 구조 역할을 합니다. 2024년 가장 일반적인 HTML 태그와 고급 용도를 이해함으로써 개발자는 보다 효율적이고 접근 가능하며 시각적으로 매력적인 웹 페이지를 ...
    프로그램 작성 2024-11-05에 게시됨
  • CSS 미디어 쿼리
    CSS 미디어 쿼리
    웹사이트가 다양한 기기에서 원활하게 작동하도록 보장하는 것이 그 어느 때보다 중요합니다. 사용자가 데스크톱, 노트북, 태블릿, 스마트폰에서 웹사이트에 액세스함에 따라 반응형 디자인이 필수가 되었습니다. 반응형 디자인의 중심에는 개발자가 사용자 기기의 특성에 따라 다양한...
    프로그램 작성 2024-11-05에 게시됨
  • JavaScript의 호이스팅 이해: 종합 가이드
    JavaScript의 호이스팅 이해: 종합 가이드
    자바스크립트에서 호이스팅 호이스팅은 변수 및 함수 선언을 포함 범위(전역 범위 또는 함수 범위)의 맨 위로 이동(또는 "호이스팅")하는 동작입니다. 코드가 실행됩니다. 즉, 코드에서 실제로 선언되기 전에 변수와 함수를 사용할 수 있습니...
    프로그램 작성 2024-11-05에 게시됨
  • Stripe를 단일 제품 Django Python Shop에 통합
    Stripe를 단일 제품 Django Python Shop에 통합
    In the first part of this series, we created a Django online shop with htmx. In this second part, we'll handle orders using Stripe. What We'll...
    프로그램 작성 2024-11-05에 게시됨
  • Laravel에서 대기 중인 작업을 테스트하기 위한 팁
    Laravel에서 대기 중인 작업을 테스트하기 위한 팁
    Laravel 애플리케이션으로 작업할 때 명령이 비용이 많이 드는 작업을 수행해야 하는 시나리오를 접하는 것이 일반적입니다. 기본 프로세스를 차단하지 않으려면 대기열에서 처리할 수 있는 작업으로 작업을 오프로드하기로 결정할 수 있습니다. 예제를 살펴보겠습니다. app:...
    프로그램 작성 2024-11-05에 게시됨
  • 인간 수준의 자연어 이해(NLU) 시스템을 만드는 방법
    인간 수준의 자연어 이해(NLU) 시스템을 만드는 방법
    Scope: Creating an NLU system that fully understands and processes human languages in a wide range of contexts, from conversations to literature. ...
    프로그램 작성 2024-11-05에 게시됨
  • JSTL을 사용하여 HashMap 내에서 ArrayList를 반복하는 방법은 무엇입니까?
    JSTL을 사용하여 HashMap 내에서 ArrayList를 반복하는 방법은 무엇입니까?
    JSTL을 사용하여 HashMap 내에서 ArrayList 반복웹 개발에서 JSTL(JavaServer Pages Standard Tag Library)은 JSP( 자바 서버 페이지). 그러한 작업 중 하나는 데이터 구조를 반복하는 것입니다.HashMap과 그 안에 포...
    프로그램 작성 2024-11-05에 게시됨
  • Encore.ts — ElysiaJS 및 Hono보다 빠릅니다.
    Encore.ts — ElysiaJS 및 Hono보다 빠릅니다.
    몇 달 전 우리는 TypeScript용 오픈 소스 백엔드 프레임워크인 Encore.ts를 출시했습니다. 이미 많은 프레임워크가 있으므로 우리는 우리가 내린 흔하지 않은 디자인 결정과 그것이 어떻게 놀라운 성능 수치로 이어지는지 공유하고 싶었습니다. 성능 ...
    프로그램 작성 2024-11-05에 게시됨
  • 문자열 리터럴에서 +를 사용한 문자열 연결이 실패하는 이유는 무엇입니까?
    문자열 리터럴에서 +를 사용한 문자열 연결이 실패하는 이유는 무엇입니까?
    문자열 리터럴을 문자열과 연결C에서는 연산자를 사용하여 문자열과 문자열 리터럴을 연결할 수 있습니다. 그러나 이 기능에는 혼란을 초래할 수 있는 제한 사항이 있습니다.질문에서 작성자는 문자열 리터럴 "Hello", ",world" 및...
    프로그램 작성 2024-11-05에 게시됨
  • React Re-Rendering: 최적의 성능을 위한 모범 사례
    React Re-Rendering: 최적의 성능을 위한 모범 사례
    React의 효율적인 렌더링 메커니즘은 React가 인기를 얻는 주요 이유 중 하나입니다. 그러나 애플리케이션이 복잡해짐에 따라 구성 요소 다시 렌더링을 관리하는 것이 성능을 최적화하는 데 중요해졌습니다. React의 렌더링 동작을 최적화하고 불필요한 재렌더링을 방지하...
    프로그램 작성 2024-11-05에 게시됨
  • 조건부 열 생성을 달성하는 방법: Pandas DataFrame에서 If-Elif-Else 탐색?
    조건부 열 생성을 달성하는 방법: Pandas DataFrame에서 If-Elif-Else 탐색?
    조건부 열 생성: Pandas의 If-Elif-Else주어진 문제에서는 DataFrame에 새 열을 추가해야 합니다. 일련의 조건부 기준을 기반으로 합니다. 문제는 코드 효율성과 가독성을 유지하면서 이러한 조건을 구현하는 것입니다.함수 적용을 사용한 솔루션한 가지 접근...
    프로그램 작성 2024-11-05에 게시됨

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3