「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > タグを削除する前に頑固な HTML 特殊文字を削除するにはどうすればよいですか?

タグを削除する前に頑固な HTML 特殊文字を削除するにはどうすればよいですか?

2024 年 11 月 8 日に公開
ブラウズ:817

How to Remove Stubborn HTML Special Characters Before Stripping Tags?

頑固な HTML 特殊文字の除去

strip_tags 関数は、HTML タグの削除には優れていますが、次のような厄介な HTML 特殊文字には対処できません。非改行スペースの場合は「©」、著作権記号の場合は「©」です。これは、クリーンな RSS フィードを作成する際の障害となる可能性があります。

この問題を解決するには、次のいずれかの方法を利用することを検討してください:

  • HTML エンティティ デコード:文字列がstrip_tagsを受ける前に、html_entity_decodeを使用して特殊コードを元の文字に変換します。処理.
  • 正規表現の削除: あるいは、preg_replace 関数を使用して、これらの文字をターゲットにして文字列から直接削除します。このタスクを実行するサンプル パターンは次のとおりです:
$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);

上記のパターンには、エンコードされていないテキスト内の本物のアンパサンド文字 (&) が意図せず置き換えられるのを防ぐために、Jacco によって提案された修正が含まれていることに注意してください。 {2,8} の文字範囲を指定することにより、パターンは HTML 特殊コードをターゲットにする際にさらに識別力が高くなります。

リリースステートメント この記事は次の場所に転載されています: 1729256054 権利侵害がある場合は、[email protected] に連絡して削除してください。
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3