Entdecken Sie die JLAMA -Bibliothek mit Spring Boot und Langchain

Titelseite > Programmierung > Entdecken Sie die JLAMA -Bibliothek mit Spring Boot und Langchain

Entdecken Sie die JLAMA -Bibliothek mit Spring Boot und Langchain

Gepostet am 2025-04-17

Durchsuche:987

Explorando a Biblioteca JLama com Spring Boot e LangChain

Großsprachige Modelle (LLMs) transformieren verschiedene Felder, einschließlich Softwareentwicklung. Ihre Fähigkeit, Text (und andere Datentypen) zu verstehen und zu generieren, ermöglicht Codevorschlag, Korrektur und sogar die Erzeugung von textlichen Eingabeaufforderungen. In diesem Artikel wird die jlama bibliothek, eine Java-basierte Lösung zur Integration von LLMs in das Java-Ökosystem untersucht. JLAMA bietet Flexibilität, nutzbar als Befehlszeilenschnittstelle (CLI) oder als Abhängigkeit in Ihren Projekten (z. B. über pom.xml ). Wir werden seine Funktionalität demonstrieren, indem wir sie in eine Spring Boot application.

integrieren.

Voraussetzungen und hervorhebt

jLama benötigt java 20 oder höher aufgrund der Verwendung der Java -Vektor -API. Existent langchain

Benutzer können es in JLAMA integrieren und Langchains Tools zur vereinfachten LLM -Interaktion nutzen.

Dieses Beispiel Projekt enthält zwei Endpunkte, die mit LLMs mit Aufgaben interagieren:

project Implementation

jlama endpoint

Dieser Endpunkt verwendet JLAMA direkt, um Antworten basierend auf Benutzeranforderungen zu generieren.

@PostMapping("/jlama") // Endpoint for JLama chat functionality
public ResponseEntity chatJlama(@RequestBody ChatPromptRequest request) {
    PromptContext context;
    if (abstractModel.promptSupport().isPresent()) {
        context = abstractModel.promptSupport()
                .get()
                .builder()
                .addSystemMessage("You are a helpful chatbot providing concise answers.")
                .addUserMessage(request.prompt())
                .build();
    } else {
        context = PromptContext.of(request.prompt());
    }

    System.out.println("Prompt: "   context.getPrompt()   "\n");
    Generator.Response response = abstractModel
            .generate(UUID.randomUUID(), context, 0.0f, 256, (s, f) -> {});
    System.out.println(response.responseText);

    return ResponseEntity.ok(new ChatPromptResponse(response.responseText));
}

Das gewünschte Modell ist definiert. Wenn nicht lokal verfügbar, wird es automatisch in das angegebene Verzeichnis heruntergeladen. Der schnelle Kontext wird erstellt und JLAMA generiert die Antwort.

// Defining the model and directory for downloading (if needed) from Hugging Face
String model = "tjake/Llama-3.2-1B-Instruct-JQ4";
String workingDirectory = "./models";

// Downloading (if necessary) or retrieving the model locally
File localModelPath = new Downloader(workingDirectory, model).huggingFaceModel();

// Loading the model
ModelSupport.loadModel(localModelPath, DType.F32, DType.I8);

Langchain und Jlama Endpoint

Dieser Endpunkt verwendet Langchain und reduziert den für die JLAMA -Interaktion erforderlichen Code.

@PostMapping("/langchain")
public ResponseEntity

Langchain vereinfacht die Implementierung, indem das Modell und die Parameter direkt im Erbauer definiert werden.

Links und Referenzen

Dieses Projekt wurde von der Präsentation von Professor Isidro bei Soujava inspiriert. [Link zur Präsentation (ersetzen Sie, falls dies verfügbar ist)]

Nützliche Dokumentation:

Abschluss

jlama und Langchain bieten eine leistungsstarke Möglichkeit, LLMs in Java -Anwendungen zu integrieren. In diesem Artikel wurde gezeigt, wie man diese Tools mit Spring Boot konfiguriert und verwendet, um effiziente textliche Eingabeaufforderungs -Verarbeitungsendpunkte zu erstellen.

Hast du mit LLMs in Java -Projekten gearbeitet? Teilen Sie Ihre Erfahrungen und Erkenntnisse in den Kommentaren!

Neuestes Tutorial Mehr>

Aufrufen von Python -Funktionsmethoden von Java mit Jython
Python -Funktionen aus Java mit Jython Obwohl Jython in erster Linie dafür bekannt ist, Java -Anrufe von Python -Skripten zu aktivieren, hat es ...

Programmierung Gepostet am 2025-04-19
Wie kann ich mehrere Benutzertypen (Schüler, Lehrer und Administratoren) in ihre jeweiligen Aktivitäten in einer Firebase -App umleiten?
rot: Wie man mehrere Benutzertypen zu jeweiligen Aktivitäten umleitet Login. Der aktuelle Code verwaltet die Umleitung für zwei Benutzertypen erf...

Programmierung Gepostet am 2025-04-19
Warum HTML keine Seitenzahlen und Lösungen drucken kann
können Seitenzahlen auf html -Seiten nicht drucken? Gebraucht: @page { Marge: 10%; @Top-Center { Schriftfamilie: Sans-Serif; Schrift...

Programmierung Gepostet am 2025-04-19
Wie vereinfachte ich JSON-Parsen in PHP für mehrdimensionale Arrays?
JSON mit PHP versuchen, JSON-Daten in PHP zu analysieren, kann eine Herausforderung sein, insbesondere im Umgang mit mehrdimensionalen Arrays. U...

Programmierung Gepostet am 2025-04-19
Warum werden globale Variablen in der Programmierung als schädlich angesehen?
Warum globale Variablen in der Programmierung notorisch böse sind Die Frage, warum globale Variablen als programmierend angesehen werden, insb...

Programmierung Gepostet am 2025-04-19
Wie kann ich bei der Erstellung von SQL -Abfragen in Go sicher Text und Werte verkettet?
concattenieren Text und Werte in Go SQL -Abfragen Bei der Erstellung eines Text -SQL -Abfrages in GO, es gibt bestimmte Syntax -Regeln, die be...

Programmierung Gepostet am 2025-04-19
Leitfaden zur Lösung von CORS -Problemen in der Frühjahrssicherheit 4.1 und höher
Spring Security CORS Filter: Fehlerbehebung gemeinsame Ausgaben Bei der Integration von Frühlingssicherheit in ein vorhandenes Projekt können ...

Programmierung Gepostet am 2025-04-19
Warum erfordern Lambda -Ausdrücke in Java "endgültige" oder "gültige endgültige" Variablen?
Lambda Expressions Require "Final" or "Effectively Final" VariablesThe error message "Variable used in lambda expression shou...

Programmierung Gepostet am 2025-04-19
Gründe, warum Python keine Fehler beim Schneiden des Hyperscope -Substring meldet
substring schneiden mit index außerhalb von Bereich: Dualität und leere Sequenzen In Python, Zugriff auf Elemente einer Sequenz mit dem Slicin...

Programmierung Gepostet am 2025-04-19
$Wie kann man sich geweigert, das Skript zu laden ... \ "Fehler aufgrund der Inhaltssicherheitsrichtlinie von Android?$
Wie kann man sich geweigert, das Skript zu laden ... \ "Fehler aufgrund der Inhaltssicherheitsrichtlinie von Android?
enthüllen die mystery: Inhaltssicherheit Richtlinienfehler begegnen dem rätselhaften Fehler ", das Skript zu laden ..." beim Bereits...

Programmierung Gepostet am 2025-04-19
Wie kann ich das CSS-Attribut der ": After" -Pseudo-Element mit JQuery effektiv ändern?
die Einschränkungen von Pseudo-Elementen in jQuery: Zugriff auf die ": After" selector in Webentwicklung, Pseudo-Elemente mögen &quo...

Programmierung Gepostet am 2025-04-19
Flachung und Ravel: Numpy -Funktionsauswahlhandbuch
den Unterschied zwischen Numpys Flach- und Ravel-Funktionen verstehen Die numpy-Bibliothek bietet zwei Methoden, flach und ravel, um mehrdimen...

Programmierung Gepostet am 2025-04-19
Wie kombinieren Sie Daten aus drei MySQL -Tabellen zu einer neuen Tabelle?
mySql: Erstellen einer neuen Tabelle aus Daten und Spalten von drei Tabellen Frage: Wie können ich eine neue Tabelle erstellen. Aus den Pe...

Programmierung Gepostet am 2025-04-19
Tipps für die Bindung von Ereignishörern für dynamisch hinzugefügte HTML -Elemente mit JQuery
Anhängen von Ereignissen an dynamische html -Elemente in jQuery Wenn Sie mit dynamisch geladenem Inhalt in Webanwendungen arbeiten und Ereigni...

Programmierung Gepostet am 2025-04-19
Der Compiler -Fehler "usr/bin/ld: kann nicht -l" -Lösung finden
Dieser Fehler gibt an, dass der Linker die angegebene Bibliothek beim Verknüpfen Ihrer ausführbaren Datei nicht finden kann. Um dieses Problem z...

Programmierung Gepostet am 2025-04-19

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel