Wie funktioniert ein geschichtsbewusster Retriever?

Titelseite > Programmierung > Wie funktioniert ein geschichtsbewusster Retriever?

Wie funktioniert ein geschichtsbewusster Retriever?

Veröffentlicht am 08.11.2024

Durchsuche:749

How a history-aware retriever works?

Der in diesem Beitrag besprochene geschichtsbewusste Retriever ist derjenige, der von der Funktion „create_history_aware_retriever“ aus dem LangChain-Paket zurückgegeben wird. Diese Funktion ist so konzipiert, dass sie in ihrem Konstruktor die folgenden Eingaben empfängt:

Ein LLM (ein Sprachmodell, das eine Anfrage empfängt und eine Antwort zurückgibt);
Ein Vector Store Retriever (ein Modell, das eine Abfrage empfängt und eine Liste relevanter Dokumente zurückgibt).
Ein Chat-Verlauf (eine Liste von Nachrichteninteraktionen, normalerweise zwischen einem Menschen und einer KI).

Beim Aufruf nimmt der historienbewusste Retriever eine Benutzerabfrage als Eingabe und gibt eine Liste relevanter Dokumente aus. Die relevanten Dokumente basieren auf der Abfrage in Kombination mit dem Kontext, der durch den Chatverlauf bereitgestellt wird.

Am Ende fasse ich den Arbeitsablauf zusammen.

Einstellen

from langchain.chains import create_history_aware_retriever
from langchain_community.document_loaders import WebBaseLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_chroma import Chroma
from dotenv import load_dotenv
import bs4

load_dotenv() # To get OPENAI_API_KEY

def create_vectorsore_retriever():
    """
    Returns a vector store retriever based on the text of a specific web page.
    """
    URL = r'https://lilianweng.github.io/posts/2023-06-23-agent/'
    loader = WebBaseLoader(
        web_paths=(URL,),
        bs_kwargs=dict(
            parse_only=bs4.SoupStrainer(class_=("post-content", "post-title", "post-header"))
        ))
    docs = loader.load()
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0, add_start_index=True)
    splits = text_splitter.split_documents(docs)
    vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())
    return vectorstore.as_retriever()

def create_prompt():
    """
    Returns a prompt instructed to produce a rephrased question based on the user's
    last question, but referencing previous messages (chat history).
    """
    system_instruction = """Given a chat history and the latest user question \
        which might reference context in the chat history, formulate a standalone question \
        which can be understood without the chat history. Do NOT answer the question, \
        just reformulate it if needed and otherwise return it as is."""

    prompt = ChatPromptTemplate.from_messages([
        ("system", system_instruction),
        MessagesPlaceholder("chat_history"),
        ("human", "{input}")])
    return prompt

llm = ChatOpenAI(model='gpt-4o-mini')
vectorstore_retriever = create_vectorsore_retriever()
prompt = create_prompt()

history_aware_retriever = create_history_aware_retriever(
    llm,
    vectorstore_retriever,
    prompt
)

Benutze es

Hier wird eine Frage ohne Chatverlauf gestellt, sodass der Retriever nur mit den für die letzte Frage relevanten Dokumenten antwortet.

chat_history = []

docs = history_aware_retriever.invoke({'input': 'what is planning?', 'chat_history': chat_history})
for i, doc in enumerate(docs):
    print(f'Chunk {i 1}:')
    print(doc.page_content)
    print()

Chunk 1:
Planning is essentially in order to optimize believability at the moment vs in time.
Prompt template: {Intro of an agent X}. Here is X's plan today in broad strokes: 1)
Relationships between agents and observations of one agent by another are all taken into consideration for planning and reacting.
Environment information is present in a tree structure.

Chunk 2:
language. Essentially, the planning step is outsourced to an external tool, assuming the availability of domain-specific PDDL and a suitable planner which is common in certain robotic setups but not in many other domains.

Chunk 3:
Another quite distinct approach, LLM P (Liu et al. 2023), involves relying on an external classical planner to do long-horizon planning. This approach utilizes the Planning Domain Definition Language (PDDL) as an intermediate interface to describe the planning problem. In this process, LLM (1) translates the problem into “Problem PDDL”, then (2) requests a classical planner to generate a PDDL plan based on an existing “Domain PDDL”, and finally (3) translates the PDDL plan back into natural

Chunk 4:
Planning

Subgoal and decomposition: The agent breaks down large tasks into smaller, manageable subgoals, enabling efficient handling of complex tasks.
Reflection and refinement: The agent can do self-criticism and self-reflection over past actions, learn from mistakes and refine them for future steps, thereby improving the quality of final results.


Memory

Jetzt weiß der Retriever anhand des Chatverlaufs, dass der Mensch sowohl über die Aufgabenzerlegung als auch über die Planung Bescheid wissen möchte. Es antwortet also mit Textteilen, die sich auf beide Themen beziehen.

chat_history = [
    ('human', 'when I ask about planning I want to know about Task Decomposition too.')]

docs = history_aware_retriever.invoke({'input': 'what is planning?', 'chat_history': chat_history})
for i, doc in enumerate(docs):
    print(f'Chunk {i 1}:')
    print(doc.page_content)
    print()

Chunk 1:
Task decomposition can be done (1) by LLM with simple prompting like "Steps for XYZ.\n1.", "What are the subgoals for achieving XYZ?", (2) by using task-specific instructions; e.g. "Write a story outline." for writing a novel, or (3) with human inputs.

Chunk 2:
Fig. 1. Overview of a LLM-powered autonomous agent system.
Component One: Planning#
A complicated task usually involves many steps. An agent needs to know what they are and plan ahead.
Task Decomposition#

Chunk 3:
Planning

Subgoal and decomposition: The agent breaks down large tasks into smaller, manageable subgoals, enabling efficient handling of complex tasks.
Reflection and refinement: The agent can do self-criticism and self-reflection over past actions, learn from mistakes and refine them for future steps, thereby improving the quality of final results.


Memory

Chunk 4:
Challenges in long-term planning and task decomposition: Planning over a lengthy history and effectively exploring the solution space remain challenging. LLMs struggle to adjust plans when faced with unexpected errors, making them less robust compared to humans who learn from trial and error.

Jetzt basiert die gesamte Frage auf dem Chatverlauf. Und wir können sehen, dass es mit Textteilen antwortet, die auf das richtige Konzept verweisen.

chat_history = [
    ('human', 'What is ReAct?'),
    ('ai', 'ReAct integrates reasoning and acting within LLM by extending the action space to be a combination of task-specific discrete actions and the language space')]

docs = history_aware_retriever.invoke({'input': 'It is a way of doing what?', 'chat_history': chat_history})
for i, doc in enumerate(docs):
    print(f'Chunk {i 1}:')
    print(doc.page_content)
    print()

Chunk 1:
ReAct (Yao et al. 2023) integrates reasoning and acting within LLM by extending the action space to be a combination of task-specific discrete actions and the language space. The former enables LLM to interact with the environment (e.g. use Wikipedia search API), while the latter prompting LLM to generate reasoning traces in natural language.
The ReAct prompt template incorporates explicit steps for LLM to think, roughly formatted as:
Thought: ...
Action: ...
Observation: ...

Chunk 2:
Fig. 2. Examples of reasoning trajectories for knowledge-intensive tasks (e.g. HotpotQA, FEVER) and decision-making tasks (e.g. AlfWorld Env, WebShop). (Image source: Yao et al. 2023).
In both experiments on knowledge-intensive tasks and decision-making tasks, ReAct works better than the Act-only baseline where Thought: … step is removed.

Chunk 3:
The LLM is provided with a list of tool names, descriptions of their utility, and details about the expected input/output.
It is then instructed to answer a user-given prompt using the tools provided when necessary. The instruction suggests the model to follow the ReAct format - Thought, Action, Action Input, Observation.

Chunk 4:
Case Studies#
Scientific Discovery Agent#
ChemCrow (Bran et al. 2023) is a domain-specific example in which LLM is augmented with 13 expert-designed tools to accomplish tasks across organic synthesis, drug discovery, and materials design. The workflow, implemented in LangChain, reflects what was previously described in the ReAct and MRKLs and combines CoT reasoning with tools relevant to the tasks:

Abschluss

Zusammenfassend funktioniert der Workflow der History-Aware Retriever wie folgt, wenn .invoke({'input': '...', 'chat_history': '...'}) aufgerufen wird:

Es ersetzt die Platzhalter „input“ und „chat_history“ in der Eingabeaufforderung durch angegebene Werte und erstellt eine neue gebrauchsfertige Eingabeaufforderung, die im Wesentlichen lautet: „Nehmen Sie diesen Chatverlauf und diese letzte Eingabe und formulieren Sie die letzte Eingabe neu.“ so, dass jeder es verstehen kann, ohne den Chatverlauf zu sehen.“
Es sendet die neue Eingabeaufforderung an das LLM und empfängt eine umformulierte Eingabe.
Dann sendet es die umformulierte Eingabe an den Vector Store Retriever und empfängt eine Liste von Dokumenten, die für diese umformulierte Eingabe relevant sind.
Abschließend wird diese Liste der relevanten Dokumente zurückgegeben.

Obs.: Es ist wichtig zu beachten, dass die Einbettung, die zum Umwandeln von Text in einen Vektor verwendet wird, diejenige ist, die angegeben wird, wenn Chroma.from_documents aufgerufen wird. Wenn keine angegeben ist (im vorliegenden Fall), wird die Standard-Chroma-Einbettung verwendet.

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://dev.to/guilhermecxe/how-a-history-aware-retriever-works-5e07?1 Bei Verstößen wenden Sie sich bitte an [email protected], um ihn zu löschen

Neuestes Tutorial Mehr>

Was ist mit dem Spaltenversatz in Bootstrap 4 Beta passiert?
Bootstrap 4 Beta: Die Entfernung und Wiederherstellung des SpaltenversatzesBootstrap 4 führte in seiner Beta-1-Version wesentliche Änderungen an der A...

Programmierung Veröffentlicht am 26.12.2024
Verwendung von WebSockets in Go für Echtzeitkommunikation
Das Erstellen von Apps, die Echtzeitaktualisierungen erfordern – wie Chat-Anwendungen, Live-Benachrichtigungen oder Tools für die Zusammenarbeit – erf...

Programmierung Veröffentlicht am 26.12.2024
Wie behebt man „Unsachgemäß konfiguriert: Fehler beim Laden des MySQLdb-Moduls“ in Django unter macOS?
MySQL falsch konfiguriert: Das Problem mit relativen PfadenBeim Ausführen von python manage.py runserver in Django kann der folgende Fehler auftreten:...

Programmierung Veröffentlicht am 26.12.2024
Jenseits von „if“-Anweisungen: Wo sonst kann ein Typ mit einer expliziten „bool“-Konvertierung ohne Umwandlung verwendet werden?
Kontextuelle Konvertierung in bool ohne Umwandlung zulässigIhre Klasse definiert eine explizite Konvertierung in bool, sodass Sie ihre Instanz „t“ dir...

Programmierung Veröffentlicht am 26.12.2024
Wie kombiniere ich zwei assoziative Arrays in PHP und behalte dabei eindeutige IDs bei und verarbeite doppelte Namen?
Kombinieren assoziativer Arrays in PHPIn PHP ist das Kombinieren zweier assoziativer Arrays zu einem einzigen Array eine häufige Aufgabe. Betrachten S...

Programmierung Veröffentlicht am 26.12.2024
Wie kann ich mit MySQL Benutzer mit den heutigen Geburtstagen finden?
So identifizieren Sie Benutzer mit den heutigen Geburtstagen mithilfe von MySQLUm mithilfe von MySQL festzustellen, ob heute der Geburtstag eines Benu...

Programmierung Veröffentlicht am 26.12.2024
Wie konvertiert man alle Arten von intelligenten Anführungszeichen in PHP?
Konvertieren Sie alle Arten von intelligenten Anführungszeichen in PHPIntelligente Anführungszeichen sind typografische Zeichen, die anstelle normaler...

Programmierung Veröffentlicht am 26.12.2024
Welche verschiedenen Möglichkeiten gibt es, ein JavaScript-Array zu durchlaufen?
Durchlaufen eines Arrays mit JavaScriptDas Durchlaufen der Elemente eines Arrays ist eine häufige Aufgabe in JavaScript. Es stehen mehrere Ansätze zur...

Programmierung Veröffentlicht am 26.12.2024
Wie kann man die Ausführung von Selenium WebDriver in Python effizient anhalten?
Wartende und bedingte Anweisungen in Selenium WebDriverFrage: Wie kann ich die Ausführung von Selenium WebDriver in Python für Millisekunden anhalten?...

Programmierung Veröffentlicht am 26.12.2024
Sollten C++-Zuweisungsoperatoren virtuell sein?
Virtuelle Zuweisungsoperatoren und ihre Notwendigkeiten in C Während Zuweisungsoperatoren in C als virtuell definiert werden können, ist dies keine zw...

Programmierung Veröffentlicht am 26.12.2024
Let vs. Var in JavaScript: Was ist der Unterschied in Umfang und Verwendung?
Let vs. Var in JavaScript: Gültigkeitsbereich und zeitliche Totzonen entmystifizierenDie in ECMAScript 6 eingeführte let-Anweisung hat bei Entwicklern...

Programmierung Veröffentlicht am 26.12.2024
Wie teile ich mithilfe von JavaScript eine Zeichenfolge durch Kommas auf und ignoriere Kommas in doppelten Anführungszeichen?
Teilen Sie eine Zeichenfolge durch Kommas auf und ignorieren Sie Kommas in doppelten Anführungszeichen mit JavaScript.Um die Herausforderung zu bewält...

Programmierung Veröffentlicht am 26.12.2024
Was bewirkt das Ausrufezeichen (!) in einem JavaScript-Funktionsausdruck?
Den Zweck des Ausrufezeichens in einem Funktionsausdruck enthüllenIn JavaScript ist beim Ausführen von Code ein Ausrufezeichen (!) aufgetreten Eine Fu...

Programmierung Veröffentlicht am 26.12.2024
Wie greife ich in Go programmgesteuert auf die Dateigruppen-ID (GID) zu?
Zugriff auf die Dateigruppen-ID (GID) in GoIn Go ruft die Funktion os.Stat() Dateiinformationen, einschließlich ihres Systems, ab -spezifische Attribu...

Programmierung Veröffentlicht am 26.12.2024
Bitte stellen Sie mir den Artikel zur Verfügung. Ich benötige den Text des Artikels, um einen passenden Titel im Fragestil zu generieren.
**

Programmierung Veröffentlicht am 26.12.2024

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel