用有限的资源微调 LLAMA 或文本分类

首页 > 编程 > 用有限的资源微调 LLAMA 或文本分类

用有限的资源微调 LLAMA 或文本分类

发布于2024-09-01

Fine-tuning LLAMA or Text Classification with Limited Resources

我最近需要在工作中对特定用例的句子进行分类。记得 Jeremy Howard 的第 4 课：针对绝对初学者的 NLP 入门，我首先改编了他的笔记本来微调 DEBERTA。

它有效，但并不令我满意，所以我很好奇如果我使用像 LLAMA 3 这样的法学硕士会发生什么。问题是什么？ GPU 资源有限。我只能访问 Tesla/Nvidia T4 实例。

研究让我找到了 QLORA。这个关于使用 QLoRA 微调 LLama 3 LLM 进行股票情绪文本分类的教程特别有用。为了更好地理解本教程，我将第 4 课改编到 QLORA 教程笔记本中。

QLORA 使用两种主要技术：

量化：降低模型精度，使其更小。
LORA（低阶适应）：添加小型可训练层，而不是微调整个模型。

这使我能够在 16GB VRAM T4 上训练 LLAMA 3 8B，使用大约 12GB 的 VRAM。结果出奇的好，预测准确率超过90%。

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

这是详细介绍该过程的 iPython 笔记本。

这种方法表明可以在有限的硬件上使用大型语言模型。在限制条件下工作通常会带来创造性的问题解决和学习机会。在这种情况下，这些限制促使我探索和实施更有效的微调技术。

版本声明本文转载于：https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1如有侵犯，请联系[email protected]删除

最新教程更多>

如何为PostgreSQL中的每个唯一标识符有效地检索最后一行？
postgresql：为每个唯一标识符在postgresql中提取最后一行，您可能需要遇到与数据集合中每个不同标识的信息相关的信息。考虑以下数据：[ 1 2014-02-01 kjkj 在数据集中的每个唯一ID中检索最后一行的信息，您可以在操作员上使用Postgres的有效效率： id dat...

编程发布于2025-03-13
为什么尽管有效代码，为什么在PHP中捕获输入？
在php ;?>" method="post">The intention is to capture the input from the text box and display it when the submit button is clicked.但是，输出...

编程发布于2025-03-13
版本5.6.5之前，使用current_timestamp与时间戳列的current_timestamp与时间戳列有什么限制？
在时间戳列上使用current_timestamp或MySQL版本中的current_timestamp或在5.6.5 此限制源于遗留实现的关注，这些限制需要对当前的_timestamp功能进行特定的实现。创建表`foo`（ `Productid` int（10）unsigned not n...

编程发布于2025-03-13
在Java中使用for-to-loop和迭代器进行收集遍历之间是否存在性能差异？
For Each Loop vs. Iterator: Efficiency in Collection TraversalIntroductionWhen traversing a collection in Java, the choice arises between using a for-...

编程发布于2025-03-13
HTML格式标签
HTML 格式化元素 **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to format text without us...

编程发布于2025-03-13
如何在整个HTML文档中设计特定元素类型的第一个实例？

编程发布于2025-03-13
我可以将加密从McRypt迁移到OpenSSL，并使用OpenSSL迁移MCRYPT加密数据？
将我的加密库从mcrypt升级到openssl 问题：是否可以将我的加密库从McRypt升级到OpenSSL？如果是这样，如何？答案：是的，可以将您的Encryption库从McRypt升级到OpenSSL。可以使用openssl。附加说明： [openssl_decrypt（）函数要求iv参...

编程发布于2025-03-13
如何从Python中的字符串中删除表情符号：固定常见错误的初学者指南？
从python import codecs import codecs import codecs 导入 text = codecs.decode（'这狗\ u0001f602'.encode（'utf-8'），'utf-8'）印刷（文字）＃带有...

编程发布于2025-03-13
为什么Microsoft Visual C ++无法正确实现两台模板的实例？
The Mystery of "Broken" Two-Phase Template Instantiation in Microsoft Visual C Problem Statement:Users commonly express concerns that Micro...

编程发布于2025-03-13
为什么使用Firefox后退按钮时JavaScript执行停止？
导航历史记录问题：JavaScript使用Firefox Back Back 此行为是由浏览器缓存JavaScript资源引起的。要解决此问题并确保在后续页面访问中执行脚本，Firefox用户应设置一个空功能。警报'）; }; alert（'inline Alert'）...

编程发布于2025-03-13
如何干净地删除匿名JavaScript事件处理程序？
删除匿名事件侦听器将匿名事件侦听器添加到元素中会提供灵活性和简单性，但是当要删除它们时，可以构成挑战，而无需替换元素本身就可以替换一个问题。 element？ element.addeventlistener（event，function（）{/在这里工作/}，false）; 要解决此问题，请考虑...

编程发布于2025-03-13
PHP阵列键值异常：了解07和08的好奇情况
PHP数组键值问题，使用07&08 在给定数月的数组中，键值07和08呈现令人困惑的行为时，就会出现一个不寻常的问题。运行print_r（$月份）返回意外结果：键“ 07”丢失，而键“ 08”分配给了9月的值。此问题源于PHP对领先零的解释。当一个数字带有0（例如07或08）的前缀时，PHP将...

编程发布于2025-03-13
如何使用PHP将斑点（图像）正确插入MySQL？
essue VALUES('$this->image_id','file_get_contents($tmp_image)')";This code builds a string in PHP, but the function call ...

编程发布于2025-03-13
如何检查对象是否具有Python中的特定属性？
方法来确定对象属性存在寻求一种方法来验证对象中特定属性的存在。考虑以下示例，其中尝试访问不确定属性会引起错误： >>> a = someClass（） >>> A.property Trackback（最近的最新电话）：文件“ ”，第1行， AttributeError: SomeClass...

编程发布于2025-03-13
如何克服PHP的功能重新定义限制？
克服PHP的函数重新定义限制在PHP中，多次定义一个相同名称的函数是一个no-no。尝试这样做，如提供的代码段所示，将导致可怕的“不能重新列出”错误。但是，PHP工具腰带中有一个隐藏的宝石：runkit扩展。它使您能够灵活地重新定义函数。 runkit_function_renction_re...

编程发布于2025-03-13