從 RSS Feed 中移除 HTML 特殊字元
建立 RSS feed 檔案時,使用 PHP 的 strip_tags 函數刪除 HTML 標籤是常見做法。但是,此函數通常無法刪除 HTML 特殊程式碼字符,例如 、& 和 ©。
要有效刪除這些字符,請考慮以下選項:
選項1:使用html_entity_decode
您可以使用html_entity_decode 將這些字符解碼回其原始形式。
$decodedContent = html_entity_decode($originalContent);
選項2:使用preg_replace
或,您可以使用preg_replace 與正規表示式直接刪除字元:
$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);
此模式比對表示為數字實體的HTML 特殊字元( ; 例如)或命名實體( )。
替代模式
要提高替換的準確性,請考慮使用以下修改後的模式,如雅科:
$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);
此模式將替換限制為2 到8 個字元的實體,從而降低了意外替換的風險。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3