」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 以有限的資源微調 LLAMA 或文本分類

以有限的資源微調 LLAMA 或文本分類

發佈於2024-09-01
瀏覽:634

Fine-tuning LLAMA or Text Classification with Limited Resources

我最近需要在工作中對特定用例的句子進行分類。記得 Jeremy Howard 的第 4 課:針對絕對初學者的 NLP 入門,我首先改編了他的筆記本來微調 DEBERTA。

它有效,但並不令我滿意,所以我很好奇如果我使用像 LLAMA 3 這樣的法學碩士會發生什麼。問題是什麼? GPU 資源有限。我只能存取 Tesla/Nvidia T4 實例。

研究讓我找到了 QLORA。這個關於使用 QLoRA 微調 LLama 3 LLM 進行股票情緒文字分類的教學特別有用。為了更好地理解本教程,我將第 4 課改編到 QLORA 教程筆記本中。

QLORA 使用兩種主要技術:

  1. 量化:降低模型精度,使其更小。
  2. LORA(低階適應):增加小型可訓練層,而不是微調整個模型。

這使我能夠在 16GB VRAM T4 上訓練 LLAMA 3 8B,使用大約 12GB 的 VRAM。結果出奇的好,預測準確率超過90%。

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

這是詳細介紹該過程的 iPython 筆記本。

這種方法表明可以在有限的硬體上使用大型語言模型。在限制條件下工作通常會帶來創造性的問題解決和學習機會。在這種情況下,這些限制促使我探索和實施更有效的微調技術。

版本聲明 本文轉載於:https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 如何根據條件布林邏輯取代Python列表中的元素?
    如何根據條件布林邏輯取代Python列表中的元素?
    Python 列表替換為條件布爾邏輯給定一個值列表,您可能希望根據健康)狀況。條件由函數condition()定義,可以根據元素的值來決定是否要替換元素。本題探討了在Python中實現這種替換的不同方法,同時提供了替換奇數元素的範例條件。 解決方案1:列表理解最有效的方法執行此替換是利用列表理解。此...
    程式設計 發佈於2024-11-06
  • 如何根據 Python 中的條件取代清單中的值?
    如何根據 Python 中的條件取代清單中的值?
    Python 中根據條件替換清單中的值在Python 中,您可能會遇到需要操作清單中元素的情況清單,例如根據特定條件替換值。透過利用有效的技術,您可以有效地執行這些修改。 一種方法涉及利用列表理解。例如,如果您有一個列表[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 並且想要替...
    程式設計 發佈於2024-11-06
  • 如何使用 Docker Scratch 在 Golang 中建立靜態二進位檔案:CGO_ENABLED=0 和 -ldflags?
    如何使用 Docker Scratch 在 Golang 中建立靜態二進位檔案:CGO_ENABLED=0 和 -ldflags?
    在Golang 中建立靜態二進位檔案的標誌當使用Docker 暫存庫在Golang 中建立靜態二進位檔案時,必須包含CGO_ENABLED =0 和-ldflags '-extldflags "-static"' 標誌。雖然這兩個選項可能看起來多餘,但它們在實現靜...
    程式設計 發佈於2024-11-06
  • 我可以將行追加到 CSV 檔案而不覆蓋它嗎?
    我可以將行追加到 CSV 檔案而不覆蓋它嗎?
    在Python 中向現有CSV 檔案追加新行:一種更有效的方法當您需要使用附加行更新CSV文件時,您可能會考慮以下問題:問: 是否可以向現有CSV 文件添加新行,而無需覆蓋和重新創建文件? 答: 絕對!以下是將行追加到 CSV 檔案的更有效方法:您可以利用Python 中的 with 語句。 以下程...
    程式設計 發佈於2024-11-06
  • Nestjs、Firebase、GCloud。如何在 TypeScript 中快速設定 API 後端。
    Nestjs、Firebase、GCloud。如何在 TypeScript 中快速設定 API 後端。
    It's great that you decided to open this article. My name is Fedor, and I've been a full-stack developer on a permanent basis since the end of 2021. J...
    程式設計 發佈於2024-11-06
  • 如何在維護非同步操作的同時避免鍊式函數中的 jQuery Promise?
    如何在維護非同步操作的同時避免鍊式函數中的 jQuery Promise?
    在鍊式函數中迴避jQuery Promise儘管建議避免jQuery Promise,但開發人員在不使用jQuery 的情況下鏈接非同步jQuery 函數時可能會面臨挑戰Promise 處理機制,如.then() 或.when()。為了解決這個問題,請考慮以下方法:jQuery Promise 可以...
    程式設計 發佈於2024-11-06
  • 為什麼「repr」方法在 Python 中至關重要?
    為什麼「repr」方法在 Python 中至關重要?
    探討repr方法的意義在Python程式設計的脈絡中,repr 方法在將物件表示為字串方面起著關鍵作用。這種簡潔而詳細的表示有多種用途:repr的目的方法:repr的主要目標方法的目的是傳回一個物件的字串表示形式,該物件既是人類可讀的,而且重要的是,是明確的。這種表示法應該足以重新建立具有相同狀態和...
    程式設計 發佈於2024-11-06
  • 每個開發人員都應該了解可擴展和高效應用程式的頂級 React 設計模式
    每個開發人員都應該了解可擴展和高效應用程式的頂級 React 設計模式
    隨著 React 繼續主導前端生態系統,掌握其設計模式可以顯著提高應用程式的效率和可擴展性。 React 設計模式提供了組織和建置元件、管理狀態、處理 props 和提高可重複使用性的最佳實踐。在本部落格中,我們將探討一些關鍵的 React 設計模式,這些模式可以讓您的開發流程從優秀走向卓越。 ...
    程式設計 發佈於2024-11-06
  • 在 React 中建立無限滾動元件
    在 React 中建立無限滾動元件
    介绍 我们在应用程序和网页中看到无限滚动,尤其是希望我们滚动的社交媒体。虽然无意识地滚动不好,但构建自己的无限滚动是很棒的。作为开发人员,我们应该尝试重新创建我们在网上冲浪时看到的组件。它可以挑战您在实现某些组件时了解更多信息并跳出框框进行思考。 此外,如果您希望在应用程序中实现无...
    程式設計 發佈於2024-11-06
  • 在 React 中建立響應式會議圖塊的動態網格系統
    在 React 中建立響應式會議圖塊的動態網格系統
    In the era of remote work and virtual meetings, creating a responsive and dynamic grid system for displaying participant video tiles is crucial. Inspi...
    程式設計 發佈於2024-11-06
  • 使用 Spring Boot 和 Spring Cloud 開發微服務
    使用 Spring Boot 和 Spring Cloud 開發微服務
    微服務架構已成為建構可擴展和模組化系統的流行解決方案。透過微服務,您可以將單一應用程式分解為更小的、獨立的和專業的服務,這使得系統的維護和發展變得更加容易。在這篇文章中,我們將探討如何使用 Spring Boot 和 Spring Cloud 來創造健壯且有效率的微服務。 微服務簡介 微服務背後的...
    程式設計 發佈於2024-11-06
  • 克服 PHP DOM XML 解析中的挑戰:問題與解決方案
    克服 PHP DOM XML 解析中的挑戰:問題與解決方案
    簡化PHP DOM XML 解析:揭開要點當您瀏覽PHP DOM 函數的複雜性時,可能會出現某些障礙。為了解決這些挑戰,讓我們開始了解 DOM 的複雜性,並找出常見問題的解決方案。 問題1:使用xml:id 馴服ID當使用ID 來防止樹中出現重複頁面時,PHP 的DOM 遇到了一個難題:getEle...
    程式設計 發佈於2024-11-06
  • 密碼重設功能:使用 OTP 重設密碼
    密碼重設功能:使用 OTP 重設密碼
    後端 2. 重設密碼 轉向下一個 API。 PUT 上 /api/reset-password, req -> otp, email, 新密碼, res -> nocontent // controllers/passwordReset.go func Reset...
    程式設計 發佈於2024-11-06
  • 如何從全域站點套件繼承 Virtualenv 中的特定套件?
    如何從全域站點套件繼承 Virtualenv 中的特定套件?
    從全域網站套件繼承Virtualenv 中的特定套件為了增強虛擬環境(virtualenv) 的功能,您可能會想要從全域網站繼承特定套件網站套件目錄。這種方法允許您選擇性地將重要的程式庫合併到您的 virtualenv 中,而無需直接安裝它們。 繼承方法要實現這種繼承,請使用以下命令建立新的virt...
    程式設計 發佈於2024-11-06
  • 如何解決 EF6 中的“找不到 'MySql.Data.MySqlClient\'\”錯誤?
    如何解決 EF6 中的“找不到 'MySql.Data.MySqlClient\'\”錯誤?
    MySQL 實體框架的提供者註冊使用MySQL 和實體框架時,您可能會遇到錯誤「找不到Entity Framework提供者” 'MySql.Data.MySqlClient' ADO.NET 提供者。 「儘管安裝了最新的MySQL 連接器,您可能仍然會遇到此問題。出現此問題的原因是...
    程式設計 發佈於2024-11-06

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3