」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 以有限的資源微調 LLAMA 或文本分類

以有限的資源微調 LLAMA 或文本分類

發佈於2024-09-01
瀏覽:316

Fine-tuning LLAMA or Text Classification with Limited Resources

我最近需要在工作中對特定用例的句子進行分類。記得 Jeremy Howard 的第 4 課:針對絕對初學者的 NLP 入門,我首先改編了他的筆記本來微調 DEBERTA。

它有效,但並不令我滿意,所以我很好奇如果我使用像 LLAMA 3 這樣的法學碩士會發生什麼。問題是什麼? GPU 資源有限。我只能存取 Tesla/Nvidia T4 實例。

研究讓我找到了 QLORA。這個關於使用 QLoRA 微調 LLama 3 LLM 進行股票情緒文字分類的教學特別有用。為了更好地理解本教程,我將第 4 課改編到 QLORA 教程筆記本中。

QLORA 使用兩種主要技術:

  1. 量化:降低模型精度,使其更小。
  2. LORA(低階適應):增加小型可訓練層,而不是微調整個模型。

這使我能夠在 16GB VRAM T4 上訓練 LLAMA 3 8B,使用大約 12GB 的 VRAM。結果出奇的好,預測準確率超過90%。

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

這是詳細介紹該過程的 iPython 筆記本。

這種方法表明可以在有限的硬體上使用大型語言模型。在限制條件下工作通常會帶來創造性的問題解決和學習機會。在這種情況下,這些限制促使我探索和實施更有效的微調技術。

版本聲明 本文轉載於:https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • \“(1)vs.(;;):編譯器優化是否消除了性能差異?\”
    \“(1)vs.(;;):編譯器優化是否消除了性能差異?\”
    答案: 在大多數現代編譯器中,while(1)和(1)和(;;)之間沒有性能差異。編譯器: perl: 1 輸入 - > 2 2 NextState(Main 2 -E:1)V-> 3 9 Leaveloop VK/2-> A 3 toterloop(next-> 8 last-> 9 ...
    程式設計 發佈於2025-03-13
  • 在多版本Java環境下如何為Maven指定特定版本?
    在多版本Java環境下如何為Maven指定特定版本?
    為maven 指定Java版本,您有多個Java版本,您需要在系統上安裝多個Java版本,並且需要配置特定的特定版本(E. e..7)。但是,儘管有Java_Home參數。 java_home =“ c:\ program文件\ java \ jdk1.7.0” mvn ...Once Mave...
    程式設計 發佈於2025-03-13
  • 為什麼PYTZ最初顯示出意外的時區偏移?
    為什麼PYTZ最初顯示出意外的時區偏移?
    與pytz 最初從pytz獲得特定的偏移。例如,亞洲/hong_kong最初顯示一個七個小時37分鐘的偏移: 差異源利用本地化將時區分配給日期,使用了適當的時區名稱和偏移量。但是,直接使用DateTime構造器分配時區不允許進行正確的調整。 example pytz.timezone(&#...
    程式設計 發佈於2025-03-13
  • 如何檢查對像是否具有Python中的特定屬性?
    如何檢查對像是否具有Python中的特定屬性?
    方法來確定對象屬性存在尋求一種方法來驗證對像中特定屬性的存在。考慮以下示例,其中嘗試訪問不確定屬性會引起錯誤: >>> a = someClass() >>> A.property Trackback(最近的最新電話): 文件“ ”,第1行, AttributeError: SomeClass...
    程式設計 發佈於2025-03-13
  • 如何修復\“常規錯誤:2006 MySQL Server在插入數據時已經消失\”?
    如何修復\“常規錯誤:2006 MySQL Server在插入數據時已經消失\”?
    How to Resolve "General error: 2006 MySQL server has gone away" While Inserting RecordsIntroduction:Inserting data into a MySQL database can...
    程式設計 發佈於2025-03-13
  • HTML格式標籤
    HTML格式標籤
    HTML 格式化元素 **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to format text without us...
    程式設計 發佈於2025-03-13
  • 如何使用FormData()處理多個文件上傳?
    如何使用FormData()處理多個文件上傳?
    )處理多個文件輸入時,通常需要處理多個文件上傳時,通常是必要的。 The fd.append("fileToUpload[]", files[x]); method can be used for this purpose, allowing you to send multi...
    程式設計 發佈於2025-03-13
  • 如何使用Glob在子文件夾中搜索特定文件?
    如何使用Glob在子文件夾中搜索特定文件?
    搜索散佈在不同文件夾和子文件夾中的大量文件可能是一項艱鉅的任務。但是,PHP的Glob函數提供了一個多功能解決方案來應對這一挑戰。 最初的嘗試使用Glob在根目錄中搜索搜索。要將其覆蓋範圍擴展到根之外,請考慮以下兩種方法: 1。帶有rglob函數的遞歸環球: RGLOB函數通過啟用遞歸搜索來增強G...
    程式設計 發佈於2025-03-13
  • 版本5.6.5之前,使用current_timestamp與時間戳列的current_timestamp與時間戳列有什麼限制?
    版本5.6.5之前,使用current_timestamp與時間戳列的current_timestamp與時間戳列有什麼限制?
    在時間戳列上使用current_timestamp或MySQL版本中的current_timestamp或在5.6.5 此限制源於遺留實現的關注,這些限制需要對當前的_timestamp功能進行特定的實現。 創建表`foo`( `Productid` int(10)unsigned not ...
    程式設計 發佈於2025-03-13
  • 如何為PostgreSQL中的每個唯一標識符有效地檢索最後一行?
    如何為PostgreSQL中的每個唯一標識符有效地檢索最後一行?
    postgresql:為每個唯一標識符在postgresql中提取最後一行,您可能需要遇到與數據集合中每個不同標識的信息相關的信息。考慮以下數據:[ 1 2014-02-01 kjkj 在數據集中的每個唯一ID中檢索最後一行的信息,您可以在操作員上使用Postgres的有效效率: id dat...
    程式設計 發佈於2025-03-13
  • Java是否允許多種返回類型:仔細研究通用方法?
    Java是否允許多種返回類型:仔細研究通用方法?
    在Java中的多個返回類型:一種誤解類型:在Java編程中揭示,在Java編程中,Peculiar方法簽名可能會出現,可能會出現,使開發人員陷入困境,使開發人員陷入困境。 getResult(string s); ,其中foo是自定義類。該方法聲明似乎擁有兩種返回類型:列表和E。但這確實是如此嗎...
    程式設計 發佈於2025-03-13
  • 我應該在班上創建災難嗎?
    我應該在班上創建災難嗎?
    何時需要創建析構函數? 在類設計中,開發者經常會糾結是否需要創建析構函數。 然而,理解析構函數的恰當用法至關重要。 創建析構函數的原因 通常只有當類持有昂貴的非託管資源(例如數據庫連接或文件句柄)時,才需要析構函數。在這種情況下,析構函數負責在不再需要對象時釋放這些資源,確保正確清理。 析...
    程式設計 發佈於2025-03-13
  • 我可以將加密從McRypt遷移到OpenSSL,並使用OpenSSL遷移MCRYPT加密數據?
    我可以將加密從McRypt遷移到OpenSSL,並使用OpenSSL遷移MCRYPT加密數據?
    將我的加密庫從mcrypt升級到openssl 問題:是否可以將我的加密庫從McRypt升級到OpenSSL?如果是這樣,如何? 答案:是的,可以將您的Encryption庫從McRypt升級到OpenSSL。 可以使用openssl。 附加說明: [openssl_decrypt()函數要求...
    程式設計 發佈於2025-03-13
  • 如何限制動態大小的父元素中元素的滾動範圍?
    如何限制動態大小的父元素中元素的滾動範圍?
    在交互式接口中實現垂直滾動元素的CSS高度限制,控制元素的滾動行為對於確保用戶體驗和可訪問性是必不可少的。一種這樣的方案涉及限制動態大小的父元素中元素的滾動範圍。 問題:考慮一個佈局,其中我們具有與用戶垂直滾動一起移動的可滾動地圖div,同時與固定的固定sidebar保持一致。但是,地圖的滾動無限...
    程式設計 發佈於2025-03-13
  • 如何從PHP中的數組中提取隨機元素?
    如何從PHP中的數組中提取隨機元素?
    從陣列中的隨機選擇,可以輕鬆從數組中獲取隨機項目。考慮以下數組:; 從此數組中檢索一個隨機項目,利用array_rand( array_rand()函數從數組返回一個隨機鍵。通過將$項目數組索引使用此鍵,我們可以從數組中訪問一個隨機元素。這種方法為選擇隨機項目提供了一種直接且可靠的方法。
    程式設計 發佈於2025-03-13

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3