في عالم اليوم، حيث نتعرض لوابل من المعلومات، أصبحت القدرة على استخلاص رؤى ذات معنى من المحتوى الشامل أكثر أهمية من أي وقت مضى. سواء كنت عالم بيانات أو باحثًا أو مطورًا، فإن امتلاك الأدوات المناسبة يمكن أن يساعدك على تقسيم المستندات المعقدة إلى عناصرها الرئيسية. وهنا يأتي دور KeyBERT، وهي مكتبة بايثون قوية مصممة لاستخراج الكلمات الرئيسية والعبارات الرئيسية باستخدام تقنيات تضمين BERT.
الفهم السياقي: يستخدم KeyBERT تضمينات BERT، مما يعني أنه يلتقط العلاقات السياقية بين الكلمات. كما أنهم يستخدمون تشابه جيب التمام للتحقق من تشابه السياق الذي ينتج عنه كلمات رئيسية أكثر صلة وذات معنى.
قابلية التخصيص: تتيح لك المكتبة تخصيص معلمات مختلفة، مثل n-grams وكلمات التوقف وتغيير النموذج واستخدام الذكاء الاصطناعي المفتوح المتكامل معها وعدد الكلمات الرئيسية المراد استخراجها، مما يجعلها قابلة للتكيف مع نطاق واسع من التطبيقات.
سهولة الاستخدام: تم تصميم KeyBERT ليكون سهل الاستخدام، مما يتيح للمبتدئين والمطورين المتمرسين البدء بسرعة بأقل قدر من الإعداد.
قبل البدء باستخدام keyBERT، يجب أن يكون لديك لغة python مثبتة على جهازك. الآن، يمكنك بسهولة تثبيت مكتبة keyBERT باستخدام النقطة
pip install keybert
بمجرد التثبيت، قم بإنشاء ملف بايثون جديد في محرر التعليمات البرمجية الخاص بك واستخدم مقتطف الكود أدناه لاختبار المكتبة
from keybert import KeyBERT # Initialize KeyBERT kw_model = KeyBERT() # Sample document doc = "Machine learning is a fascinating field of artificial intelligence that focuses on the development of algorithms." # Extract keywords keywords = kw_model.extract_keywords(doc, top_n=5) # Print the keywords print(keywords)
في هذا المثال، يقوم KeyBERT بمعالجة مستند الإدخال واستخراج أهم خمس كلمات رئيسية ذات صلة.
في العالم حيث تكون البيانات وفيرة، فإن وجود أداة مثل keyBERT يمكن أن يستخرج المعلومات القيمة منها. باستخدام keyBERT، يمكنك استخراج المعلومات المخفية من البيانات النصية. أوصي بـ KeyBERT لواجهته سهلة الاستخدام، حيث أنني استخدمته شخصيًا لإكمال المشروع.
رابط لتوثيق keyBERT
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3