تفاصيل هذه المقالة أتمتة تحويل محتوى النمط الطويل (مثل منشورات المدونة) إلى مؤشرات ترابط Twitter باستخدام Google Gemini-2.0 LLM و Chromadb و SPEREMLIT. إنشاء الخيط اليدوي يستغرق وقتًا طويلاً ؛ يقوم هذا التطبيق بتبسيط العملية.
نتائج تعلم المفتاح:
(هذه المقالة جزء من علوم البيانات المدونة.)
جدول المحتويات:
Gemini-2.0: غوص عميق
Gemini-2.0 ، نموذج اللغة المتقدمة المتعددة الوسائط المتقدمة من Google (LLM) ، يعزز بشكل كبير قدرات الذكاء الاصطناعي. يمكن الوصول إليه عبر واجهة برمجة تطبيقات Gemini-2.0-flash-Exp في استوديو Vertex AI ، يتفوق في:
gemini -2.0-flash-exp API للسرعة والإخراج عالي الجودة.
chromadb: قاعدة بيانات التضمين
chromadb ، قاعدة بيانات تضمين المصدر المفتوح ، تخزن بكفاءة واسترداد تضمينات المتجهات. يسهل أدائه العالي التخزين والبحث وإدارة التضمينات التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي. يتم تمكين عمليات البحث عن التشابه من خلال فهرسة المتجهات والمقارنة.
SPEREMLIT UI: واجهة سهلة الاستخدام
SPEREMLIT هي مكتبة Python مفتوحة المصدر لبناء تطبيقات الويب التفاعلية لمشاريع AI/ML. تتيح بساطتها للمطورين إنشاء تطبيقات جذابة ووظيفية بسرعة.
ميزات المفتاح:
لماذا أتمتة توليد التغريد؟
يوفر توليد مؤشرات ترابط التغريد الأتمتة عدة مزايا:
إعداد بيئة المشروع (conda)
pip install langchain langchain-community langchain-google-genai pip install chromadb streamlit python-dotenv pypdf pydantic
ملف (في جذر المشروع) مع google_api_key.
يستخدم التطبيق العديد من ملفات Python:
services.py ، remody.py
، main.py
، و
models.py يحدد نماذج Pydantic لمحتوى المقالة ومواضيع Twitter.
Services.py يحتوي على المنطق الأساسي لمعالجة PDF ، وتوليد التضمين ، واسترجاع قطعة الصلة ، وتوليد مؤشرات الترابط باستخدام Gemini-2.0. يوفر
main.py واجهة سطر الأوامر للاختبار ، بينما يقوم
يتولى الكود بكفاءة تحميل PDF ، تقسيم النص ، إنشاء التضمين باستخدام chromadb ، وتوليد تغريدة باستخدام موجه مصنوع جيدًا.
خاتمة
يعرض هذا المشروع قوة الجمع بين تقنيات الذكاء الاصطناعي لإعادة استخدام المحتوى الفعال. تمكين Gemini-2.0 و Chromadb من توفير الوقت والإخراج عالي الجودة. تضمن البنية المعيارية الصيانة والمتوسطة ، في حين أن واجهة التبسيط تعزز إمكانية الوصول.
مفتاح الوجبات السريعة:
تكامل ناجح لأدوات الذكاء الاصطناعي المتطورة لأتمتة المحتوى العملي.
بنية معيارية لسهولة الصيانة والتحسينات المستقبلية.Q1:
Recursivecharactertextsplitter يقسم مقالات طويلة إلى قطع أصغر يمكن التحكم فيها للتضمين والتخزين في chromadb. يتم استرداد القطع ذات الصلة أثناء توليد مؤشرات الترابط باستخدام بحث التشابه.
Q2:0.7 يوفر توازنًا بين الإبداع والتماسك. اضبط هذا بناءً على احتياجاتك.
Q3:يحدد المطالبة بشكل صريح حد 280 حرفًا ، ويتم تدريب LLM على الالتزام به. يمكن إضافة التحقق البرمجي إضافي.
(ملاحظة: الصور في هذه المقالة ليست مملوكة للمؤلف ويتم استخدامها بإذن.)تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3