تجريد أحرف HTML الخاصة من موجز RSS
عند إنشاء ملفات موجز RSS، تعد إزالة علامات HTML باستخدام وظيفة strip_tags الخاصة بـ PHP ممارسة شائعة. ومع ذلك، غالبًا ما تفشل هذه الوظيفة في إزالة أحرف تعليمات برمجية HTML الخاصة مثل و& و©.
لإزالة هذه الأحرف بشكل فعال، خذ في الاعتبار الخيارات التالية:
الخيار 1: استخدام html_entity_decode
يمكنك استخدام html_entity_decode لفك ترميز هذه الأحرف وإعادتها إلى أشكالها الأصلية.
$decodedContent = html_entity_decode($originalContent);
الخيار 2: استخدام preg_replace
بدلاً من ذلك، يمكنك استخدام preg_replace مع تعبير عادي لإزالة الأحرف مباشرةً:
$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);
يطابق هذا النمط أحرف HTML الخاصة الممثلة ككيانات رقمية ( على سبيل المثال) أو الكيانات المسماة ( ).
النمط البديل
لتحسين دقة الاستبدال، فكر في استخدام النمط المعدل التالي، كما اقترحه جاكو:
$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);
يحد هذا النمط من الاستبدال للكيانات التي تتكون من 2 إلى 8 أحرف، مما يقلل من مخاطر عمليات الاستبدال غير المقصودة.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3