Affiner la classification LAMA ou texte avec des ressources limitées

Page de garde > La programmation > Affiner la classification LAMA ou texte avec des ressources limitées

Affiner la classification LAMA ou texte avec des ressources limitées

Publié le 2024-09-01

Parcourir:111

Fine-tuning LLAMA or Text Classification with Limited Resources

J'ai récemment eu besoin de classer des phrases pour un cas d'utilisation particulier au travail. En me souvenant de la leçon 4 de Jeremy Howard : Débuter avec la PNL pour les débutants absolus, j'ai d'abord adapté son cahier pour peaufiner DEBERTA.

Cela a fonctionné, mais pas à ma satisfaction, alors j'étais curieux de savoir ce qui se passerait si j'utilisais un LLM comme LAMA 3. Le problème ? Ressources GPU limitées. Je n'avais accès qu'à une instance Tesla/Nvidia T4.

La recherche m'a conduit à QLORA. Ce tutoriel sur le réglage fin de LLama 3 LLM pour la classification textuelle du sentiment boursier à l'aide de QLoRA a été particulièrement utile. Pour mieux comprendre le tutoriel, j'ai adapté la leçon 4 dans le cahier du tutoriel QLORA.

QLORA utilise deux techniques principales :

Quantisation : réduit la précision du modèle, le rendant ainsi plus petit.
LORA (Low-Rank Adaptation) : ajoute de petites couches pouvant être entraînées au lieu d'affiner l'ensemble du modèle.

Cela m'a permis d'entraîner LLAMA 3 8B sur un T4 de 16 Go de VRAM, en utilisant environ 12 Go de VRAM. Les résultats ont été étonnamment bons, avec une précision de prédiction supérieure à 90 %.

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

Voici le notebook iPython détaillant le processus.

Cette approche montre qu'il est possible de travailler avec de grands modèles de langage sur un matériel limité. Travailler avec des contraintes conduit souvent à des opportunités créatives de résolution de problèmes et d’apprentissage. Dans ce cas, les limitations m'ont poussé à explorer et à mettre en œuvre des techniques de réglage plus efficaces.

Déclaration de sortie Cet article est reproduit sur : https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1 En cas de violation, veuillez contacter study_golang@163 .com pour le supprimer

Dernier tutoriel Plus>

Python Lire le fichier CSV UnicodedeCodeerror Ultimate Solution
Unicode Decode Erreur dans la lecture du fichier CSV Lorsque vous essayez de lire un fichier CSV dans Python à l'aide du module CSV intégr...

La programmation Publié le 2025-03-13
Comment supprimer les emojis des chaînes dans Python: un guide pour débutant pour fixer les erreurs courantes?
Suppression des emojis des chaînes dans python Le code python fourni pour supprimer les emojis échoue car il contient des erreurs de syntax. L...

La programmation Publié le 2025-03-13
Pourquoi ma configuration de GO à Homebrew provoque-t-elle des problèmes d'exécution de ligne de commande?
Brew Go Configuration vs Exécution de la ligne de commande Vous avez initialement installé aller à l'aide de Homebrew, un gestionnaire de ...

La programmation Publié le 2025-03-13
Java autorise-t-il plusieurs types de retour: un regard plus approfondi sur les méthodes génériques?
Plusieurs types de retour en java: une idée fausse dévoilée dans le domaine de la programmation java, une signature de méthode particulière pe...

La programmation Publié le 2025-03-13
$\ "tandis que (1) vs pour (;;): L'optimisation du compilateur élimine-t-elle les différences de performances? \"$
\ "tandis que (1) vs pour (;;): L'optimisation du compilateur élimine-t-elle les différences de performances? \"
while (1) vs pour (;;): y a-t-il une différence de vitesse? Question: LOOPS? Réponse: Dans la plupart des compilateurs modernes, il ...

La programmation Publié le 2025-03-13
Comment récupérer efficacement la dernière ligne pour chaque identifiant unique dans PostgreSQL?
PostgreSQL: Extraction de la dernière ligne pour chaque identifiant unique Dans PostgreSql, vous pouvez rencontrer des situations de données o...

La programmation Publié le 2025-03-13
$Pourquoi la demande de postn \ 'ne capture-t-elle pas d'entrée en PHP malgré le code valide?$
Pourquoi la demande de postn \ 'ne capture-t-elle pas d'entrée en PHP malgré le code valide?
Adresses du post Demande Dysfonctionnement en php Dans l'extrait de code présenté: "Méthode =" post "> " ...

La programmation Publié le 2025-03-13
Quelles ont été les restrictions sur l'utilisation de Current_timestamp avec des colonnes horodatotes dans MySQL avant la version 5.6.5?
Restrictions sur les colonnes horodat Clause actuelle_timestamp. Cette limitation s'est étendue aux entiers INT, BigInt et SmallInt lorsqu'...

La programmation Publié le 2025-03-13
Y a-t-il une différence de performance entre l'utilisation d'une boucle for-out et un itérateur pour la traversée de collecte en Java?
pour chaque boucle vs iterator: efficacité dans la collection Traversal introduction Lorsque vous traversez une collection dans Java, le c...

La programmation Publié le 2025-03-13
Comment puis-je styliser la première instance d'un type d'élément spécifique sur un document HTML entier?
correspondant au premier élément d'un certain type dans tout le document Styling Le premier élément d'un type spécifique à travers un...

La programmation Publié le 2025-03-13
Puis-je migrer mon cryptage de McRypt à OpenSSL et décrypter les données cryptées McRypt à l'aide d'OpenSSL?
Mise à niveau de ma bibliothèque de chiffrement de McRypt à OpenSSL Puis-je mettre à niveau ma bibliothèque de cryptage à partir de McRypt à O...

La programmation Publié le 2025-03-13
Pourquoi Microsoft Visual C ++ ne parvient pas à implémenter correctement l'instanciation du modèle biphasé?
Le mystère de l'instanciation du modèle deux phases "Broken" dans Microsoft Visual C Instruction Problème: Les utilisateurs ex...

La programmation Publié le 2025-03-13
Pourquoi l'exécution de JavaScript cesse-t-elle lors de l'utilisation du bouton Firefox Retour?
Problème d'histoire de la navigation: JavaScript cesse d'exécuter après avoir utilisé le bouton de retour de Firefox Les utilisateurs ...

La programmation Publié le 2025-03-13
Comment supprimer proprement les gestionnaires d'événements JavaScript anonymes?
supprimer les auditeurs d'événements anonymes Ajouter des auditeurs d'événements anonymes aux éléments offre une flexibilité et une simp...

La programmation Publié le 2025-03-13
Anomalies de valeur clé du tableau PHP: Comprendre le cas curieux de 07 et 08
Problème de valeur de clé du tableau php avec 07 & 08 Un tableau contient divers éléments avec des touches associées. Dans PHP, un problème in...

La programmation Publié le 2025-03-13

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article