Точная настройка LLAMA или классификации текста с ограниченными ресурсами

титульная страница > программирование > Точная настройка LLAMA или классификации текста с ограниченными ресурсами

Точная настройка LLAMA или классификации текста с ограниченными ресурсами

Опубликовано 1 сентября 2024 г.

Просматривать:191

Fine-tuning LLAMA or Text Classification with Limited Resources

Недавно мне нужно было классифицировать предложения для конкретного варианта использования на работе. Вспомнив Урок 4 Джереми Ховарда «Начало работы с НЛП для абсолютных новичков», я сначала адаптировал его блокнот для точной настройки DEBERTA.

Это сработало, но не к моему удовлетворению, поэтому мне было любопытно, что произойдет, если я буду использовать LLM, такой как LLAMA 3. Проблема? Ограниченные ресурсы графического процессора. У меня был доступ только к экземпляру Tesla/Nvidia T4.

Исследования привели меня к QLORA. Это руководство по точной настройке LLama 3 LLM для текстовой классификации настроений по акциям с использованием QLoRA было особенно полезным. Чтобы лучше понять урок, я адаптировал Урок 4 в учебную тетрадь QLORA.

QLORA использует два основных метода:

Квантование: снижает точность модели, делая ее меньше.
LORA (адаптация низкого ранга): добавляет небольшие обучаемые слои вместо тонкой настройки всей модели.

Это позволило мне обучить LLAMA 3 8B на 16 ГБ видеопамяти T4, используя около 12 ГБ видеопамяти. Результаты оказались на удивление хорошими: точность прогнозирования превысила 90%.

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

Вот блокнот iPython с подробным описанием процесса.

Этот подход показывает, что можно работать с большими языковыми моделями на ограниченном оборудовании. Работа с ограничениями часто приводит к творческому решению проблем и возможностям обучения. В данном случае ограничения подтолкнули меня к изучению и внедрению более эффективных методов тонкой настройки.

Заявление о выпуске Эта статья воспроизведена по адресу: https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1 В случае каких-либо нарушений, пожалуйста, свяжитесь с Study_golang@163. .com, чтобы удалить его

Последний учебник Более>

Множество
методы являются FNS, которые можно вызвать на Objects ] Массивы являются объектами, следовательно, они также имеют методы в JS. ] ] Срез (...

программирование Опубликовано в 2025-03-13
Почему мое фоновое изображение CSS появляется?
Устранение неисправностей: CSS Фоновое изображение не отображается Вы столкнулись с проблемой, где ваше фоновое изображение не загружается, не...

программирование Опубликовано в 2025-03-13
Как разрешить расходы на путь модуля в Go Mod с помощью директивы «Заменить»?
Распространение пути преодоления модуля в Go Mod При использовании MOD можно столкнуться с конфликтом, где 3 -й пакет импортирует другой пакет...

программирование Опубликовано в 2025-03-13
Каковы были ограничения на использование current_timestamp с столбцами TimeStamp в MySQL до версии 5.6.5?
Restrictions on TIMESTAMP Columns with CURRENT_TIMESTAMP in DEFAULT or ON UPDATE Clauses in MySQL Versions Prior to 5.6.5Historically, in MySQL versio...

программирование Опубликовано в 2025-03-13
Python Read File CSV UnicoDedeCodeError Ultimate Solution
ошибка декодирования Unicod Не могу декодировать байты В позиции 2-3: усеченная \ uxxxxxxxxxxxx эта ошибка возникает, когда путь к файлу CSV со...

программирование Опубликовано в 2025-03-13
Как удалить смайлики из струн в Python: руководство для начинающих по исправлению общих ошибок?
удаление emojis из строк в Python import codecs import re text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8') print(text) # ...

программирование Опубликовано в 2025-03-13
Разрешает ли Java несколько типов возврата: более пристальный взгляд на общие методы?
множественные типы возврата в Java: a miscessception presvelired в сфере программирования Java, может возникнуть признание метода, оставляя ра...

программирование Опубликовано в 2025-03-13
$\ "В то время как (1) против (;;): Оптимизация компилятора исключает различия в производительности? \"$
\ "В то время как (1) против (;;): Оптимизация компилятора исключает различия в производительности? \"
while (1) vs. for (;;;): существует ли разница в скорости? ] Вопрос: . Использование (1) вместо (;) петли? Компиляторы: ] perl: как (1)...

программирование Опубликовано в 2025-03-13
Как эффективно получить последнюю строку для каждого уникального идентификатора в PostgreSQL?
postgresql: извлечение последней строки для каждого уникального идентификатора В Postgresql вы можете столкнуться с ситуациями, где вам необхо...

программирование Опубликовано в 2025-03-13
Почему ввод запроса в POST Захват в PHP, несмотря на действительный код?
addressing post запрос неисправность в php в представленном фрагменте кода: action='' intement. Вход из нагламента на нажим. Однако выход ...

программирование Опубликовано в 2025-03-13
Существует ли разница в производительности между использованием зала и итератора для сбора сбора в Java?
для каждого цикла против итератора: эффективность в сборе Traversal введение при переселении коллекции в Java, выборе между использованием...

программирование Опубликовано в 2025-03-13
Могу ли я перенести свой шифрование с McRypt в OpenSSL и расшифровывает данные, заполненные McRypt, используя OpenSSL?
Обновление моей библиотеки шифрования с McRypt до OpenSSL Могу ли я обновить свою библиотеку шифрования с McRypt до OpenSSL? В OpenSSL можно л...

программирование Опубликовано в 2025-03-13
Почему Microsoft Visual C ++ не может правильно реализовать двухфазной экземпляры?
загадка «Сломанная» двухфазное матричное экземпляры в Microsoft Visual C Задача задачи: пользователи обычно выражают обеспокоенность Microso...

программирование Опубликовано в 2025-03-13
Почему выполнение JavaScript прекращается при использовании кнопки Firefox Back?
Проблема истории навигации: Javascript перестает выполнять после использования кнопки Firefox Back пользователи Firefox могут столкнуться с пр...

программирование Опубликовано в 2025-03-13
Как снять анонимные обработчики событий JavaScript чисто?
] удаление слушателей анонимных событий добавление слушателей анонимных событий в элементы обеспечивают гибкость и простоту, но когда пришло врем...

программирование Опубликовано в 2025-03-13