"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > كيفية إزالة أحرف HTML الخاصة العنيدة قبل تجريد العلامات؟

كيفية إزالة أحرف HTML الخاصة العنيدة قبل تجريد العلامات؟

تم النشر بتاريخ 2024-11-08
تصفح:490

How to Remove Stubborn HTML Special Characters Before Stripping Tags?

تجريد أحرف HTML الخاصة العنيدة

وظيفة strip_tags، على الرغم من مهارتها في إزالة علامات HTML، إلا أنها تفشل في معالجة أحرف HTML الخاصة المزعجة مثل للمسافة غير المنفصلة أو © لرمز حقوق الطبع والنشر. يمكن أن يكون هذا حجر عثرة في إنشاء خلاصات RSS نظيفة.

لعلاج هذه المشكلة، فكر في استخدام إحدى الاستراتيجيات التالية:

  • فك تشفير كيان HTML: استخدم html_entity_decode لتحويل الرموز الخاصة مرة أخرى إلى أحرفها الأصلية قبل أن تخضع السلسلة الخاصة بك لمعالجة strip_tags.
  • التعبير العادي الإزالة: بدلاً من ذلك، استخدم الدالة preg_replace لاستهداف هذه الأحرف وإزالتها مباشرة من السلسلة الخاصة بك. فيما يلي نموذج نموذجي سينجز المهمة:
$Content = preg_replace("/?[a-z0-9]{2,8};/i"،" $Content);
$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);
لاحظ أن النمط أعلاه يتضمن تعديلًا اقترحته Jacco لمنع الاستبدالات غير المقصودة لأحرف علامة الضم الأصلية (&) في النص غير المشفر. من خلال تحديد نطاق أحرف {2,8}، يكون النمط أكثر تمييزًا في استهداف أكواد HTML الخاصة.

بيان الافراج أعيد طبع هذه المقالة على: 1729256054 إذا كان هناك أي انتهاك، يرجى الاتصال بـ [email protected] لحذفه
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3