Ajuste de LLAMA o clasificación de texto con recursos limitados

Página delantera > Programación > Ajuste de LLAMA o clasificación de texto con recursos limitados

Ajuste de LLAMA o clasificación de texto con recursos limitados

Publicado el 2024-09-01

Navegar:878

Fine-tuning LLAMA or Text Classification with Limited Resources

Recientemente necesitaba clasificar oraciones para un caso de uso particular en el trabajo. Recordando la Lección 4 de Jeremy Howard: Cómo empezar con la PNL para principiantes absolutos, primero adapté su cuaderno para perfeccionar DEBERTA.

Funcionó, pero no fue satisfactorio para mí, así que tenía curiosidad por saber qué pasaría si usara un LLM como LLAMA 3. ¿El problema? Recursos limitados de GPU. Solo tuve acceso a una instancia Tesla/Nvidia T4.

La investigación me llevó a QLORA. Este tutorial sobre cómo ajustar LLama 3 LLM para la clasificación de texto del sentimiento de acciones utilizando QLoRA fue particularmente útil. Para comprender mejor el tutorial, adapté la Lección 4 al cuaderno de tutoriales de QLORA.

QLORA utiliza dos técnicas principales:

Cuantización: Reduce la precisión del modelo, haciéndolo más pequeño.
LORA (adaptación de bajo rango): agrega capas pequeñas y entrenables en lugar de ajustar todo el modelo.

Esto me permitió entrenar LLAMA 3 8B en una VRAM T4 de 16 GB, usando aproximadamente 12 GB de VRAM. Los resultados fueron sorprendentemente buenos, con una precisión de predicción superior al 90 %.

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

Aquí está el cuaderno de iPython que detalla el proceso.

Este enfoque muestra que es posible trabajar con modelos de lenguaje grandes en hardware limitado. Trabajar con limitaciones a menudo conduce a la resolución creativa de problemas y a oportunidades de aprendizaje. En este caso, las limitaciones me empujaron a explorar e implementar técnicas de ajuste más eficientes.

Declaración de liberación Este artículo se reproduce en: https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1 Si hay alguna infracción, comuníquese con Study_golang@163 .com para eliminarlo

Último tutorial Más>

¿Java permite múltiples tipos de devolución: una mirada más cercana a los métodos genéricos?
múltiples tipos de retorno en java: una concepción errónea indicada en el reino de la programación de java, una firma de método de método pued...

Programación Publicado el 2025-03-13
Python Leer el archivo CSV UnicodeDeCodeError Ultimate Solution
unicode decode error en el archivo csv lectura al intentar leer un archivo csv en python usando el modulo CSV incorporado, (unicodeScal No se ...

Programación Publicado el 2025-03-13
¿Por qué no aparece mi imagen de fondo CSS?
Solución de problemas: css La imagen de fondo que no aparece ha encontrado un problema en el que su imagen de fondo no se carga a pesar de las...

Programación Publicado el 2025-03-13
¿Cómo verificar si un objeto tiene un atributo específico en Python?
para determinar el atributo de objeto existencia Esta consulta busca un método para verificar la presencia de un atributo específico dentro de...

Programación Publicado el 2025-03-13
Formación
Los métodos son fns que se pueden llamar a los objetos Las matrices son objetos, por lo tanto, también tienen métodos en js. Slice (Begi...

Programación Publicado el 2025-03-13
¿Cómo resolver las discrepancias de la ruta del módulo en el mod utilizando la Directiva Reemplazar?
Superación del módulo Discrepancia en el mod Al utilizar el mod, es posible encontrar un conflicto en el que un paquete de terceros importe ot...

Programación Publicado el 2025-03-13
¿Cuáles fueron las restricciones al usar Current_Timestamp con columnas de marca de tiempo en MySQL antes de la versión 5.6.5?
en las columnas de la marca de tiempo con cursion_timestamp en predeterminado o en las cláusulas de actualización en las versiones mySql antes de ...

Programación Publicado el 2025-03-13
¿Cómo eliminar los emojis de las cuerdas en Python: una guía para principiantes para solucionar errores comunes?
Eliminación de emojis de las cadenas en python el código de python proporcionado para eliminar emojis falla porque contiene errores de sintaxi...

Programación Publicado el 2025-03-13
¿Cómo recuperar eficientemente la última fila para cada identificador único en PostgreSQL?
postgresql: extrayendo la última fila para cada identificador único en postgresql, puede encontrar situaciones en las que necesita extraer la ...

Programación Publicado el 2025-03-13
¿Por qué no es una solicitud posterior a capturar la entrada en PHP a pesar del código válido?
abordando la solicitud de solicitud de la publicación $ _Server ['php_self'];?> "Método =" post "> [&] la intenci...

Programación Publicado el 2025-03-13
¿Existe una diferencia de rendimiento entre usar un bucle for-ENTRES y un iterador para la transmisión de recorrido en Java?
para cada bucle vs. iterator: eficiencia en la colección traversal introduction cuando la colección en java, la opción, la opción iba entr...

Programación Publicado el 2025-03-13
¿Puedo migrar mi cifrado de MCRYPT a OpenSSL y descifrar datos cifrados de MCRYPT usando OpenSSL?
actualizando mi biblioteca de cifrado de MCRYP En OpenSSL, ¿es posible descifrar datos encriptados con MCRYPT? Dos publicaciones diferentes propo...

Programación Publicado el 2025-03-13
¿Por qué Microsoft Visual C ++ no implementa correctamente la instanciación de la plantilla de dos fases?
El misterio de la plantilla de dos fases "roto" instanciación en Microsoft Visual c declaración de problemas: usuarios comúnmente ...

Programación Publicado el 2025-03-13
¿Por qué cesan la ejecución de JavaScript cuando se usa el botón de retroceso de Firefox?
Problema de historial de navegación: JavaScript deja de ejecutar después de usar el botón de retroceso de Firefox Los usuarios de Firefox pued...

Programación Publicado el 2025-03-13
¿Cómo insertar correctamente las blobs (imágenes) en MySQL usando PHP?
Inserte blobs en bases de datos MySQL con php Al intentar almacenar una imagen en una base de datos MySQL, puede encontrar un asunto. Esta gu...

Programación Publicado el 2025-03-13

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo