Erstellen Sie Ihren eigenen benutzerdefinierten LLM-Agenten mithilfe von Open-Source-Modellen (Lama)

Titelseite > Programmierung > Erstellen Sie Ihren eigenen benutzerdefinierten LLM-Agenten mithilfe von Open-Source-Modellen (Lama)

Erstellen Sie Ihren eigenen benutzerdefinierten LLM-Agenten mithilfe von Open-Source-Modellen (Lama)

Veröffentlicht am 31.10.2024

Durchsuche:884

Create your own Custom LLM Agent Using Open Source Models (llama)

In diesem Artikel erfahren Sie, wie Sie einen benutzerdefinierten Agenten erstellen, der ein Open-Source-LLM (llama3.1) verwendet, das lokal auf unserem PC ausgeführt wird. Wir werden auch Ollama und LangChain verwenden.

Gliederung

Ollama installieren
Pull-Modell
Modell bedienen
Erstellen Sie einen neuen Ordner und öffnen Sie ihn mit einem Code-Editor
Virtuelle Umgebung erstellen und aktivieren
Installieren Sie langchain langchain-ollama
Benutzerdefinierten Agenten mit Open-Source-Modell in Python erstellen
Abschluss

Installieren Sie Ollama

Befolgen Sie die Anweisungen basierend auf Ihrem Betriebssystemtyp in der GitHub-README-Datei, um Ollama zu installieren:

https://github.com/ollama/ollama

Ich verwende einen Linux-basierten PC und führe daher den folgenden Befehl in meinem Terminal aus:

curl -fsSL https://ollama.com/install.sh | sh

Modell ziehen

Rufen Sie das verfügbare LLM-Modell mit dem folgenden Befehl ab:

ollama pull llama3.1

Dadurch wird die standardmäßig getaggte Version des Modells heruntergeladen. Normalerweise verweist die Standardeinstellung auf das neueste Modell mit den kleinsten Parametern. In diesem Fall handelt es sich um das Modell llama3.1:8b.

Um eine andere Version des Modells herunterzuladen, können Sie zu https://ollama.com/library/llama3.1 gehen, die zu installierende Version auswählen und dann den Ollama-Pull-Befehl mit dem Modell und seiner Versionsnummer ausführen . Beispiel: ollama pull llama3.1:70b

Auf dem Mac werden die Modelle nach ~/.ollama/models heruntergeladen

Unter Linux (oder WSL) werden die Modelle unter /usr/share/ollama/.ollama/models gespeichert

Modell servieren

Führen Sie den folgenden Befehl aus, um Ollama zu starten, ohne die Desktop-Anwendung auszuführen.

ollama serve

Alle Modelle werden automatisch auf localhost:11434 bereitgestellt

Erstellen Sie einen neuen Ordner und öffnen Sie ihn mit einem Code-Editor

Erstellen Sie einen neuen Ordner auf Ihrem Computer und öffnen Sie ihn dann mit einem Code-Editor wie VS Code.

Erstellen und aktivieren Sie eine virtuelle Umgebung

Öffnen Sie das Terminal. Verwenden Sie den folgenden Befehl, um eine virtuelle Umgebung .venv zu erstellen und zu aktivieren:

python3 -m venv .venv

source .venv/bin/activate

Installieren Sie langchain langchain-ollama

Führen Sie den folgenden Befehl aus, um langchain und langchain-ollama zu installieren:

pip install -U langchain langchain-ollama

Der obige Befehl installiert oder aktualisiert die Pakete LangChain und LangChain-Ollama in Python. Das Flag -U stellt sicher, dass die neuesten Versionen dieser Pakete installiert werden und alle älteren Versionen ersetzen, die möglicherweise bereits vorhanden sind.

Erstellen Sie einen benutzerdefinierten Agenten mit Open-Source-Modell in Python

Erstellen Sie eine Python-Datei, zum Beispiel: main.py, und fügen Sie den folgenden Code hinzu:

from langchain_ollama import ChatOllama
from langchain.agents import tool
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.agents.format_scratchpad.openai_tools import (
    format_to_openai_tool_messages,
)
from langchain.agents import AgentExecutor
from langchain.agents.output_parsers.openai_tools import OpenAIToolsAgentOutputParser


llm = ChatOllama(
            model="llama3.1",
            temperature=0,
            verbose=True
        )

@tool
def get_word_length(word: str) -> int:
    """Returns the length of a word."""
    return len(word)


tools = [get_word_length]



prompt = ChatPromptTemplate.from_messages(
            [
                (
                    "system",
                    "You are very powerful assistant",
                ),
                ("user", "{input}"),
                MessagesPlaceholder(variable_name="agent_scratchpad"),
            ]
        )

llm_with_tools = llm.bind_tools(tools)

agent = (
    {
        "input": lambda x: x["input"],
        "agent_scratchpad": lambda x: format_to_openai_tool_messages(
            x["intermediate_steps"]
        ),
    }
    | prompt
    | llm_with_tools
    | OpenAIToolsAgentOutputParser()
)

# Create an agent executor by passing in the agent and tools
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
result = agent_executor.invoke({"input": "How many letters in the word educa"})

if result:
    print(f"[Output] --> {result['output']}")
else:
    print('There are no result..')

Das obige Code-Snippet richtet einen LangChain-Agenten ein, der das ChatOllama-Modell (llama3.1) verwendet, um Benutzereingaben zu verarbeiten und ein benutzerdefiniertes Tool zu verwenden, das die Wortlänge berechnet. Es definiert eine Eingabeaufforderungsvorlage für den Agenten, bindet das Tool an das Sprachmodell und erstellt einen Agenten, der Eingaben verarbeitet und Zwischenschritte formatiert. Schließlich wird ein AgentExecutor erstellt, um den Agenten mit einer bestimmten Eingabe aufzurufen. Wir stellen eine einfache Frage: „Wie viele Buchstaben hat das Wort educa?“ und drucken dann die Ausgabe aus oder geben an, ob kein Ergebnis gefunden wurde.

Wenn wir ausführen, erhalten wir das folgende Ergebnis:

> Entering new AgentExecutor chain...

Invoking: `get_word_length` with `{'word': 'educa'}`


5The word "educa" has 5 letters.

> Finished chain.
[Output] --> The word "educa" has 5 letters.

Sie sehen, dass der Agent das Modell (llama3.1) verwendet hat, um das Tool korrekt aufzurufen und die Anzahl der Buchstaben im Wort zu ermitteln.

Abschluss

Danke fürs Lesen.

Sehen Sie sich das Ollama-Repo hier an: https://github.com/ollama/ollama

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://dev.to/emmakodes_/create-your-own-custom-llm-agent-using-open-source-models-llama31-4aag?1 Bei Verstößen wenden Sie sich bitte an Study_golang @163.com löschen

Neuestes Tutorial Mehr>

Veröffentlichen von CLI-Apps (mit Apt & YUM)
Einführung Ich bin in letzter Zeit ein großer Fan von CLI-Apps geworden. Vielleicht ist es der Reiz des Terminals meiner Kindheit (angefangen...

Programmierung Veröffentlicht am 08.11.2024
Supersonic GPU MelSpectrogram für Ihre Echtzeitanwendungen
Hier bei Simli liegt uns die Latenz am meisten am Herzen. Darum geht es uns schließlich: Videos mit geringer Latenz. Andererseits weisen einige der am...

Programmierung Veröffentlicht am 08.11.2024
So installieren und verwenden Sie „next-sitemap“ in einer Next.js-App: Eine Schritt-für-Schritt-Anleitung
Wenn Sie eine Website mit Next.js erstellen, möchten Sie wahrscheinlich, dass Suchmaschinen Ihre Seiten effizient entdecken und indizieren. Eine Mögli...

Programmierung Veröffentlicht am 08.11.2024
Eine Kurzanleitung zum Python-Threading-Modul mit Beispielen
Einführung Das Threading-Modul in Python bietet eine High-Level-Schnittstelle zum Erstellen und Verwalten von Threads, sodass Sie Code gleich...

Programmierung Veröffentlicht am 08.11.2024
✨ Vom Mitwirkenden zum Hauptprojektbetreuer: Meine Open-Source-Reise ✨
Alles begann mit einem einfachen Pull-Request... Ich erinnere mich, als ich mich zum ersten Mal in die Welt von Open Source wagte. Mein ursprüngliches...

Programmierung Veröffentlicht am 08.11.2024
Die Grundlagen der Programmierung: Eine sanfte Einführung in C
Grundlagen der C-Sprache: Variablen und Typen: Definieren Sie Variablen zum Speichern von Daten, und der Typ gibt den Typ der gespeicherten Daten an....

Programmierung Veröffentlicht am 08.11.2024
Wie verbessern Mixins die Klassenfunktionalität ohne traditionelle Vererbung?
Mixins verstehen: Ein modularer Ansatz für KlassenerweiterungenEin Mixin ist ein Software-Designmuster, das die Zusammensetzung mehrerer Klassen ermög...

Programmierung Veröffentlicht am 08.11.2024
Können in PHP anonyme Objekte wie in JavaScript erstellt werden?
Anonyme Objekte in PHP erstellenIn JavaScript können anonyme Objekte einfach erstellt werden. Kann diese Technik jedoch auch auf PHP angewendet werden...

Programmierung Veröffentlicht am 08.11.2024
Warum stürzt mein Programm unter Windows Vista nur im Release-Modus ab?
Programmabstürze nur im Release Build: Eintauchen in Debugging-UnklarheitenDie Begegnung mit einem seltsamen „Schrödinger's Cat“-Bug kann Programm...

Programmierung Veröffentlicht am 08.11.2024
Python-Schleifen 2
Hallo zusammen! Dies ist unser zweiter Teil der Python-Loop-Serie. Teil 1 ist hier: https://dev.to/coderanger08/python-loops-1-5dho In dieser Woche w...

Programmierung Veröffentlicht am 08.11.2024
Können Sie Iteratoren aus verschiedenen Containern in C++ vergleichen?
Vergleich von Iteratoren aus verschiedenen Containern: Eine warnende GeschichteIn C stellen Iteratoren einen leistungsstarken Mechanismus zum Durchlau...

Programmierung Veröffentlicht am 08.11.2024
Spring Boot: Die Revolution in der Java-Anwendungsentwicklung
Wenn Sie in Java entwickeln, haben Sie vielleicht schon von Spring Boot gehört. Aber wenn Sie es noch nicht wissen, machen Sie sich bereit, eines der ...

Programmierung Veröffentlicht am 08.11.2024
Was bewirkt das kaufmännische Und (&) in LESS-CSS-Pseudoelementselektoren?
Das kaufmännische Und (&) in CSS-Pseudoelementselektoren entmystifizierenWenn man in CSS auf Code wie diesen stößt, fragt man sich natürlich über die ...

Programmierung Veröffentlicht am 08.11.2024
Wie aktualisiere ich Zeilen und erhalte aktualisierte IDs in MySQL ohne Unterabfrage?
Das Kombinieren von SELECT- und UPDATE-Abfragen in MySQLDas Kombinieren von SELECT- und UPDATE-Abfragen in einem einzigen Vorgang kann zur Optimierung...

Programmierung Veröffentlicht am 08.11.2024
Migration von SQLite auf MySQL.
Ich stelle mich vor, ich bin Alfredo Riveros und lerne seit einigen Jahren etwas über das Programmieren, ich studiere derzeit Higher Technician in Sof...

Programmierung Veröffentlicht am 08.11.2024

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel