”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 用有限的资源微调 LLAMA 或文本分类

用有限的资源微调 LLAMA 或文本分类

发布于2024-09-01
浏览:201

Fine-tuning LLAMA or Text Classification with Limited Resources

我最近需要在工作中对特定用例的句子进行分类。记得 Jeremy Howard 的第 4 课:针对绝对初学者的 NLP 入门,我首先改编了他的笔记本来微调 DEBERTA。

它有效,但并不令我满意,所以我很好奇如果我使用像 LLAMA 3 这样的法学硕士会发生什么。问题是什么? GPU 资源有限。我只能访问 Tesla/Nvidia T4 实例。

研究让我找到了 QLORA。这个关于使用 QLoRA 微调 LLama 3 LLM 进行股票情绪文本分类的教程特别有用。为了更好地理解本教程,我将第 4 课改编到 QLORA 教程笔记本中。

QLORA 使用两种主要技术:

  1. 量化:降低模型精度,使其更小。
  2. LORA(低阶适应):添加小型可训练层,而不是微调整个模型。

这使我能够在 16GB VRAM T4 上训练 LLAMA 3 8B,使用大约 12GB 的 VRAM。结果出奇的好,预测准确率超过90%。

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

这是详细介绍该过程的 iPython 笔记本。

这种方法表明可以在有限的硬件上使用大型语言模型。在限制条件下工作通常会带来创造性的问题解决和学习机会。在这种情况下,这些限制促使我探索和实施更有效的微调技术。

版本声明 本文转载于:https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • Nestjs、Firebase、GCloud。如何在 TypeScript 中快速设置 API 后端。
    Nestjs、Firebase、GCloud。如何在 TypeScript 中快速设置 API 后端。
    It's great that you decided to open this article. My name is Fedor, and I've been a full-stack developer on a permanent basis since the end of 2021. J...
    编程 发布于2024-11-06
  • 如何在维护异步操作的同时避免链式函数中的 jQuery Promise?
    如何在维护异步操作的同时避免链式函数中的 jQuery Promise?
    在链式函数中回避 jQuery Promise尽管建议避免 jQuery Promise,但开发人员在不使用 jQuery 的情况下链接异步 jQuery 函数时可能会面临挑战Promise 处理机制,如 .then() 或 .when()。为了解决这个问题,请考虑以下方法:jQuery Promi...
    编程 发布于2024-11-06
  • 为什么“repr”方法在 Python 中至关重要?
    为什么“repr”方法在 Python 中至关重要?
    探索repr方法的意义在Python编程的上下文中,repr 方法在将对象表示为字符串方面起着关键作用。这种简洁而详细的表示有多种用途:repr的目的方法:repr的主要目标方法的目的是返回一个对象的字符串表示形式,该对象既是人类可读的,而且重要的是,是明确的。这种表示应该足以重新创建具有相同状态和...
    编程 发布于2024-11-06
  • 每个开发人员都应该了解可扩展和高效应用程序的顶级 React 设计模式
    每个开发人员都应该了解可扩展和高效应用程序的顶级 React 设计模式
    随着 React 继续主导前端生态系统,掌握其设计模式可以显着提高应用程序的效率和可扩展性。 React 设计模式提供了组织和构建组件、管理状态、处理 props 和提高可重用性的最佳实践。在本博客中,我们将探讨一些关键的 React 设计模式,这些模式可以使您的开发过程从优秀走向卓越。 ...
    编程 发布于2024-11-06
  • 在 React 中构建无限滚动组件
    在 React 中构建无限滚动组件
    介绍 我们在应用程序和网页中看到无限滚动,尤其是希望我们滚动的社交媒体。虽然无意识地滚动不好,但构建自己的无限滚动是很棒的。作为开发人员,我们应该尝试重新创建我们在网上冲浪时看到的组件。它可以挑战您在实现某些组件时了解更多信息并跳出框框进行思考。 此外,如果您希望在应用程序中实现无...
    编程 发布于2024-11-06
  • 在 React 中构建响应式会议图块的动态网格系统
    在 React 中构建响应式会议图块的动态网格系统
    In the era of remote work and virtual meetings, creating a responsive and dynamic grid system for displaying participant video tiles is crucial. Inspi...
    编程 发布于2024-11-06
  • 使用 Spring Boot 和 Spring Cloud 开发微服务
    使用 Spring Boot 和 Spring Cloud 开发微服务
    微服务架构已成为构建可扩展和模块化系统的流行解决方案。通过微服务,您可以将单一应用程序分解为更小的、独立的和专业的服务,这使得系统的维护和发展变得更加容易。在这篇文章中,我们将探讨如何使用 Spring Boot 和 Spring Cloud 创建健壮且高效的微服务。 微服务简介 微服务背后的主要思...
    编程 发布于2024-11-06
  • 克服 PHP DOM XML 解析中的挑战:问题和解决方案
    克服 PHP DOM XML 解析中的挑战:问题和解决方案
    简化 PHP DOM XML 解析:揭开要点当您浏览 PHP DOM 函数的复杂性时,可能会出现某些障碍。为了解决这些挑战,让我们开始了解 DOM 的复杂性,并找出常见问题的解决方案。问题 1:使用 xml:id 驯服 ID当使用 ID 来防止树中出现重复页面时,PHP 的 DOM 遇到了一个难题:...
    编程 发布于2024-11-06
  • 密码重置功能:使用 OTP 重置密码
    密码重置功能:使用 OTP 重置密码
    后端 2. 重置密码 转向下一个 API。 PUT 上 /api/reset-password, req -> otp, email, 新密码, res -> nocontent // controllers/passwordReset.go func ResetP...
    编程 发布于2024-11-06
  • 如何从全局站点包继承 Virtualenv 中的特定包?
    如何从全局站点包继承 Virtualenv 中的特定包?
    从全局站点包继承 Virtualenv 中的特定包为了增强虚拟环境 (virtualenv) 的功能,您可能希望从全局站点继承特定包站点包目录。这种方法允许您有选择地将重要的库合并到您的 virtualenv 中,而无需直接安装它们。继承方法要实现这种继承,请使用以下命令创建一个新的 virtual...
    编程 发布于2024-11-06
  • 如何解决 EF6 中的“找不到 'MySql.Data.MySqlClient\'\”错误?
    如何解决 EF6 中的“找不到 'MySql.Data.MySqlClient\'\”错误?
    MySQL 实体框架的提供程序注册使用 MySQL 和实体框架时,您可能会遇到错误“找不到 Entity Framework 提供程序” 'MySql.Data.MySqlClient' ADO.NET 提供程序。”尽管安装了最新的 MySQL 连接器,您可能仍然会遇到此问题。出现此...
    编程 发布于2024-11-06
  • 如何利用PHP防止邮件传输中的恶意输入?
    如何利用PHP防止邮件传输中的恶意输入?
    保护电子邮件传输的用户输入在 PHP 中,必须在发送电子邮件之前清理用户输入,以防止恶意或有害内容泄露你的系统。考虑下面的简单 PHP 邮件脚本的代码片段:<?php $to = "[email protected]"; $name = $_POST['name']; $m...
    编程 发布于2024-11-06
  • 应用页面开发
    应用页面开发
    Если посмотреть на исходный проект, то можно увидеть, что нам необходимо создать одну главную страницу. Результаты поиска авиабилетов, отелей и туров ...
    编程 发布于2024-11-06
  • Java 应用程序中的“No X11 DISPLAY Variable”错误:如何为 GUI 功能设置 DISPLAY 变量?
    Java 应用程序中的“No X11 DISPLAY Variable”错误:如何为 GUI 功能设置 DISPLAY 变量?
    Java 应用程序中的“No X11 DISPLAY Variable”错误Java 应用程序依赖于 X Window 系统 (X11) 来实现图形用户界面 ( GUI)功能。 “未设置 X11 DISPLAY 变量”错误表示应用程序无法访问 X11 显示环境。要解决此问题,请设置 X11 DISP...
    编程 发布于2024-11-06
  • 破解 HashMap 的基础知识:Java 开发人员的关键概念
    破解 HashMap 的基础知识:Java 开发人员的关键概念
    介绍 了解 HashMap 类对于开发人员来说至关重要,无论是在实际应用程序还是面试中。在这篇文章中,我们将探讨如何在 HashMap 中插入、更新和管理键值对。这些知识也将为我们的下一篇文章奠定基础,我们将深入研究 HashSet 并了解这两个集合之间的关系。 什...
    编程 发布于2024-11-06

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3