ضبط اللاما أو تصنيف النص بموارد محدودة

الصفحة الأمامية > برمجة > ضبط اللاما أو تصنيف النص بموارد محدودة

ضبط اللاما أو تصنيف النص بموارد محدودة

تم النشر بتاريخ 2024-09-01

تصفح:637

Fine-tuning LLAMA or Text Classification with Limited Resources

كنت بحاجة مؤخرًا إلى تصنيف الجمل لحالة استخدام معينة في العمل. عندما أتذكر درس جيريمي هوارد 4: البدء في البرمجة اللغوية العصبية للمبتدئين، قمت أولاً بتعديل دفتر ملاحظاته لضبط ديبرتا.

لقد نجح الأمر، ولكن ليس بما يرضيني، لذلك كنت أشعر بالفضول عما سيحدث إذا استخدمت ماجستير في القانون مثل LLAMA 3. المشكلة؟ موارد GPU محدودة. لم يكن لدي سوى إمكانية الوصول إلى مثيل Tesla/Nvidia T4.

قادني البحث إلى QLORA. كان هذا البرنامج التعليمي حول الضبط الدقيق LLama 3 LLM لتصنيف النص لمشاعر الأسهم باستخدام QLoRA مفيدًا بشكل خاص. لفهم البرنامج التعليمي بشكل أفضل، قمت بتعديل الدرس 4 في دفتر QLORA التعليمي.

تستخدم QLORA تقنيتين رئيسيتين:

التكميم: يقلل من دقة النموذج، مما يجعله أصغر.
LORA (التكيف منخفض الرتبة): يضيف طبقات صغيرة قابلة للتدريب بدلاً من ضبط النموذج بأكمله.

سمح لي هذا بتدريب LLAMA 3 8B على VRAM T4 بسعة 16 جيجابايت، باستخدام حوالي 12 جيجابايت من VRAM. وكانت النتائج جيدة بشكل مدهش، حيث تجاوزت دقة التنبؤ 90%.

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

إليك دفتر iPython الذي يعرض تفاصيل العملية.

يوضح هذا الأسلوب أنه من الممكن العمل مع نماذج اللغات الكبيرة على أجهزة محدودة. غالبًا ما يؤدي العمل مع القيود إلى حل المشكلات بشكل إبداعي وفرص التعلم. في هذه الحالة، دفعتني القيود إلى استكشاف وتنفيذ تقنيات ضبط أكثر كفاءة.

بيان الافراج تم إعادة إنتاج هذه المقالة على: https://dev.to/jkyamog/fine-tuning-llama-3-for-text-classification-with-limited-resources-4i06?1 إذا كان هناك أي انتهاك، يرجى الاتصال بـ Study_golang@163 .com لحذفه

أحدث البرنامج التعليمي أكثر>

كيف يمكنني التعامل مع عمليات تحميل ملفات متعددة باستخدام FormData ()؟
معالجة تحميلات متعددة مع تحميلات مع FormData () عند العمل مع مدخلات الملفات ، فغالبًا ما يكون من الضروري التعامل مع تحميلات الملفات المتعددة. ...

برمجة نشر في 2025-03-13
كيف يمكنني استخدام Glob للبحث عن ملف معين في المجلدات الفرعية؟
ومع ذلك ، توفر وظيفة GLOB PHP حلاً متعدد الاستخدامات لمعالجة هذا التحدي. لتوسيع نطاق وصوله إلى ما وراء الجذر ، فكر في النهجين التاليين: 1. GLOB ...

برمجة نشر في 2025-03-13
ما هي القيود المفروضة على استخدام Current_Timestamp مع أعمدة الطابع الزمني في MySQL قبل الإصدار 5.6.5؟
Current_timestamp جملة. امتد هذا القيد إلى أعداد صحيحة ، و bigint ، و smallint عندما تم تقديمها في البداية في عام 2008. Current_Timestamp Value: إ...

برمجة نشر في 2025-03-13
كيفية استرداد الصف الأخير بكفاءة لكل معرف فريد في postgresql؟
postgresql: استخراج الصف الأخير لكل معرف فريد في postgresql ، قد تواجه مواقف حيث تحتاج إلى استخراج المعلومات من الصف الأخير المرتبط بكل معرف م...

برمجة نشر في 2025-03-13
هل تسمح Java بأنواع عائدات متعددة: نظرة فاحصة على الطرق العامة؟
أنواع عائدات متعددة في java: تم الكشف عن المفاهيم الخاطئة getResult (String s) ؛ حيث Foo فئة مخصصة. يبدو أن إعلان الطريقة يضم نوعين من الإرج...

برمجة نشر في 2025-03-13
هل يجب علي إنشاء مدمرة في صفي؟
متى تحتاج إلى إنشاء مدمرة؟ في تصميم الفصل ، غالبًا ما يكافح المطورون مع ما إذا كانوا بحاجة إلى إنشاء مدمرين. ومع ذلك ، من الأهمية بمكان فهم ا...

برمجة نشر في 2025-03-13
هل يمكنني ترحيل التشفير الخاص بي من Mcrypt إلى OpenSSL ، وفك تشفير البيانات المشفرة Mcrypt باستخدام OpenSSL؟
ترقية مكتبة التشفير الخاصة بي من mcrypt إلى openssl هل يمكنني ترقية مكتبة التشفير الخاصة بي من mcrypt إلى openssl؟ في OpenSSL ، هل من الممكن ف...

برمجة نشر في 2025-03-13
كيفية الحد من نطاق التمرير لعنصر داخل عنصر الوالد الحجم ديناميكي؟
يتضمن أحد هذه السيناريو الحد من نطاق التمرير لعنصر داخل عنصر الوالدين ديناميكيًا. المشكلة: ومع ذلك ، يمتد تمرير الخريطة إلى أجل غير مسمى ، ويتج...

برمجة نشر في 2025-03-13
كيف يمكنك استخراج عنصر عشوائي من صفيف في PHP؟
اختيار عشوائي من صفيف في PHP ، يمكن تحقيق عنصر عشوائي من صفيف بسهولة. ضع في اعتبارك المصفوفة التالية: $items = [523, 3452, 334, 31, 5346];

برمجة نشر في 2025-03-13
كيفية تنسيق التواريخ كـ DD/MM/YYYY في PHP و MYSQL؟
ومع ذلك ، غالبًا ما يكون من المرغوب فيه عرض التواريخ بتنسيق "DD/MM/Yyyy" الأكثر دراية. كيف يمكن تحقيق ذلك باستخدام php mysql؟ الإجابات...

برمجة نشر في 2025-03-13
لماذا لا يوجد طلب آخر لالتقاط المدخلات في PHP على الرغم من الرمز الصحيح؟
معالجة عطل طلب النشر في php $ _server ['php_self'] ؛؟> "method =" post "> ومع ذلك ، يظل الناتج فارغًا. على الرغم من ...

برمجة نشر في 2025-03-13
كيف تقسم مجموعة إلى جميع المجموعات الفرعية الممكنة في بيثون؟
على سبيل المثال ، يؤدي تقسيم المجموعة [1 ، 2 ، 3] إلى مجموعات فرعية التالية: [[1] ، [2] ، [3]] [[1،2] ، [3]] [[1] ، [2،3]] [[1،3] ، [2]] [[1،2،3]...

برمجة نشر في 2025-03-13
كيفية إدراج النقط (الصور) بشكل صحيح في MySQL باستخدام PHP؟
مشكلة. سيوفر هذا الدليل حلولًا لتخزين بيانات الصور الخاصة بك بنجاح. إصدار ImageId ، صورة) القيم ('$ this- & gt ؛ image_id' ، 'fi...

برمجة نشر في 2025-03-13
لماذا يتوقف تنفيذ JavaScript عند استخدام زر عودة Firefox؟
مشكلة السجل الملحي: قد يتوقف JavaScript عن التنفيذ بعد استخدام زر عودة Firefox قد يواجه مستخدمو Firefox مشكلة حيث فشل JavaScriptts في الركض عن...

برمجة نشر في 2025-03-13
C# التعبيرات العادية: نصائح لمطابقة الكلمات الكاملة بالضبط
تطابق الكلمة بأكملها باستخدام التعبير العادي في C# عند استخدام تعبيرات منتظمة للعثور على التطابقات في سلسلة ، من الأهمية بمكان التأكد من مطابقة...

برمجة نشر في 2025-03-13