HTML-Sonderzeichen aus RSS-Feed entfernen
Beim Erstellen von RSS-Feed-Dateien ist das Entfernen von HTML-Tags mithilfe der Funktion „strip_tags“ von PHP gängige Praxis. Diese Funktion entfernt jedoch häufig keine HTML-Sondercodezeichen wie , & und ©.
Um diese Zeichen effektiv zu entfernen, ziehen Sie die folgenden Optionen in Betracht:
Option 1: Verwendung von html_entity_decode
Sie können html_entity_decode verwenden, um diese Zeichen wieder zu dekodieren ihre ursprünglichen Formen.
$decodedContent = html_entity_decode($originalContent);
Option 2: Verwendung von preg_replace
Alternativ können Sie verwenden preg_replace mit einem regulären Ausdruck, um die Zeichen zu entfernen direkt:
$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);
Dieses Muster stimmt überein HTML-Sonderzeichen, die als numerische Entitäten ( zum Beispiel) oder benannte Entitäten ( ) dargestellt werden.
Alternative Muster
Um die Genauigkeit der Ersetzung zu verbessern, sollten Sie das folgende modifizierte Muster verwenden, wie von Jacco vorgeschlagen:
$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);
Dieses Muster beschränkt die Ersetzung auf Entitäten mit 2 bis 8 Zeichen, wodurch das Risiko unbeabsichtigter Ersetzungen verringert wird.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3