RSS फ़ीड से HTML विशेष वर्णों को अलग करना
RSS फ़ीड फ़ाइलें बनाते समय, PHP के स्ट्रिप_टैग फ़ंक्शन का उपयोग करके HTML टैग हटाना आम बात है। हालाँकि, यह फ़ंक्शन अक्सर , &, और © जैसे HTML विशेष कोड वर्णों को हटाने में विफल रहता है।
इन वर्णों को प्रभावी ढंग से हटाने के लिए, निम्नलिखित विकल्पों पर विचार करें:
विकल्प 1: html_entity_decode का उपयोग करना
आप इन वर्णों को उनके मूल रूपों में वापस डीकोड करने के लिए html_entity_decode का उपयोग कर सकते हैं।
$decodedContent = html_entity_decode($originalContent);
विकल्प 2: preg_replace का उपयोग करना
वैकल्पिक रूप से, आप वर्णों को सीधे हटाने के लिए नियमित अभिव्यक्ति के साथ preg_replace का उपयोग कर सकते हैं:
$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);
यह पैटर्न संख्यात्मक इकाइयों के रूप में दर्शाए गए HTML विशेष वर्णों से मेल खाता है ( ; उदाहरण के लिए) या नामित इकाइयाँ ( )।
वैकल्पिक पैटर्न
प्रतिस्थापन की सटीकता में सुधार करने के लिए, निम्नलिखित संशोधित पैटर्न का उपयोग करने पर विचार करें, जैसा कि सुझाव दिया गया है जैको:
$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);
यह पैटर्न प्रतिस्थापन को 2 से 8 वर्णों वाली इकाइयों तक सीमित करता है, जिससे अनपेक्षित प्रतिस्थापन का जोखिम कम हो जाता है।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3