Feinabstimmung der LLAMA- oder Textklassifizierung mit begrenzten Ressourcen

Titelseite > Programmierung > Feinabstimmung der LLAMA- oder Textklassifizierung mit begrenzten Ressourcen

Feinabstimmung der LLAMA- oder Textklassifizierung mit begrenzten Ressourcen

Veröffentlicht am 01.09.2024

Durchsuche:678

Fine-tuning LLAMA or Text Classification with Limited Resources

Ich musste kürzlich Sätze für einen bestimmten Anwendungsfall bei der Arbeit klassifizieren. Ich erinnerte mich an Jeremy Howards Lektion 4: Erste Schritte mit NLP für absolute Anfänger und passte zunächst sein Notizbuch an, um DEBERTA zu verfeinern.

Es hat funktioniert, aber nicht zu meiner Zufriedenheit, also war ich neugierig, was passieren würde, wenn ich ein LLM wie LLAMA 3 verwenden würde. Das Problem? Begrenzte GPU-Ressourcen. Ich hatte nur Zugriff auf eine Tesla/Nvidia T4-Instanz.

Recherchen führten mich zu QLORA. Dieses Tutorial zur Feinabstimmung von LLama 3 LLM für die Textklassifizierung der Aktienstimmung mithilfe von QLoRA war besonders nützlich. Um das Tutorial besser zu verstehen, habe ich Lektion 4 in das QLORA-Tutorial-Notizbuch übernommen.

QLORA verwendet zwei Haupttechniken:

Quantisierung: Reduziert die Modellgenauigkeit und macht es kleiner.
LORA (Low-Rank Adaptation): Fügt kleine, trainierbare Schichten hinzu, anstatt das gesamte Modell zu optimieren.

Dadurch konnte ich LLAMA 3 8B auf einem 16 GB VRAM T4 trainieren und dabei etwa 12 GB VRAM verwenden. Die Ergebnisse waren überraschend gut, mit einer Vorhersagegenauigkeit von über 90 %.

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

Hier ist das iPython-Notizbuch, das den Prozess detailliert beschreibt.

Dieser Ansatz zeigt, dass es möglich ist, mit großen Sprachmodellen auf begrenzter Hardware zu arbeiten. Die Arbeit mit Einschränkungen führt oft zu kreativen Problemlösungs- und Lernmöglichkeiten. In diesem Fall drängten mich die Einschränkungen dazu, effizientere Feinabstimmungstechniken zu erforschen und zu implementieren.

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1 Bei Verstößen wenden Sie sich bitte an Study_golang@163 .com, um es zu löschen

Neuestes Tutorial Mehr>

Array
Methoden sind fns, die auf Objekte aufgerufen werden können Arrays sind Objekte, daher haben sie auch Methoden in js. Slice (Beginn): Ex...

Programmierung Gepostet am 2025-03-13
Warum erscheint mein CSS -Hintergrundbild nicht?
Fehlerbehebung: CSS -Hintergrundbild erscheinen nicht Sie haben auf ein Problem gestoßen, bei dem Ihr Hintergrundbild trotz der folgenden Tuto...

Programmierung Gepostet am 2025-03-13
Wie beheben Sie die Diskrepanzen für Modulpfade in Go -Mod mithilfe der Richtlinie Ersetzen?
überwinden Modulpfad -Diskrepanz in go mod Wenn GO mod verwendet wird, ist es möglich, auf einen Konflikt zu begegnen, bei dem ein Drittanbiet...

Programmierung Gepostet am 2025-03-13
Was waren die Einschränkungen bei der Verwendung von Current_Timestamp mit Zeitstempelspalten in MySQL vor Version 5.6.5?
Einschränkungen für Zeitstempelspalten mit Current_Timestamp in Standard- oder Aktualisierungsklauseln in MySQL -Versionen vor 5.6.5 Historisch ...

Programmierung Gepostet am 2025-03-13
Python Read CSV -Datei UnicodEdeCodeError Ultimate Lösung
unicode dekodieren Fehler in der CSV-Datei Reading Wenn versucht wird, eine CSV-Datei mit dem integrierten CSV-Modul zu lesen, können Sie eine...

Programmierung Gepostet am 2025-03-13
$\ "während (1) gegen (;;): Beseitigt die Compiler -Optimierung Leistungsunterschiede? \"$
\ "während (1) gegen (;;): Beseitigt die Compiler -Optimierung Leistungsunterschiede? \"
wob führt die Verwendung von (1) statt für (;;) zu einem Leistungsunterschied in Infinite führt Loops? Antwort: In den meisten modernen C...

Programmierung Gepostet am 2025-03-13
Wie kann ich die letzte Zeile für jede eindeutige Kennung in PostgreSQL effizient abrufen?
postgresql: Extrahieren der letzten Zeile für jede eindeutige Kennung In Postgresql können Sie Situationen begegnen, in denen Sie die Informat...

Programmierung Gepostet am 2025-03-13
Warum wird die Anfrage nicht nach dem Erfassen von Eingaben in PHP trotz gültiger Code erfasst?
adressieren nach Anfrage Fehlfunktion in php in dem vorgestellten Code -Snippet: action='' Die Intented -In -Intented -Aufnahme. Die Ausg...

Programmierung Gepostet am 2025-03-13
Gibt es einen Leistungsunterschied zwischen der Verwendung einer For-Each-Schleife und einem Iterator für die Sammlung durchquert in Java?
für jede Schleife vs. Iterator: Effizienz in der Sammlung traversal Einführung beim Durchlaufen einer Sammlung in Java, die Auswahl an der...

Programmierung Gepostet am 2025-03-13
Kann ich meine Verschlüsselung von McRypt nach OpenSSL migrieren und mit OpenSSL von McRypt-verkürzten Daten entschlüsseln?
Upgrade meiner Verschlüsselungsbibliothek von McRypt auf OpenSSL Kann ich meine Verschlüsselungsbibliothek von McRypt nach OpenSsl aufrüsten? ...

Programmierung Gepostet am 2025-03-13
Warum kann Microsoft Visual C ++ keine zweiphasige Vorlage-Instanziierung korrekt implementieren?
Das Geheimnis von "kaputte" Two-Phase-Vorlage Instantiation in Microsoft visual c Problemanweisung: Benutzer werden häufig besorgt...

Programmierung Gepostet am 2025-03-13
Warum hört die Ausführung von JavaScript ein, wenn die Firefox -Rückbutton verwendet wird?
Navigational History Problem: JavaScript hört auf, nach der Verwendung von Firefox -Back -Schaltflächen auszuführen. Dieses Problem tritt in ande...

Programmierung Gepostet am 2025-03-13
Wie entferte ich anonyme JavaScript -Ereignishandler sauber?
entfernen anonymer Ereignis -Hörer Hinzufügen von anonymen Ereignishörern zu Elementen bieten Flexibilität und Einfachheit, aber wenn es Zeit is...

Programmierung Gepostet am 2025-03-13
Wie füge ich Blobs (Bilder) mithilfe von PHP richtig in MySQL ein?
Fügen Sie Blobs in mySQL -Datenbanken mit php beim Versuch, ein Bild in einer MySQL -Datenbank zu speichern, auf eine auf ein Bild zu speiche...

Programmierung Gepostet am 2025-03-13
Wie überprüfe ich, ob ein Objekt ein spezifisches Attribut in Python hat?
Methode zur Bestimmung von Objektattribut -Existenz Diese Anfrage befriedigt eine Methode, um das Vorhandensein eines bestimmten Attributs in ...

Programmierung Gepostet am 2025-03-13

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel