"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Como remover caracteres especiais HTML teimosos antes de remover tags?

Como remover caracteres especiais HTML teimosos antes de remover tags?

Publicado em 2024-11-08
Navegar:409

How to Remove Stubborn HTML Special Characters Before Stripping Tags?

Removendo caracteres especiais HTML obstinados

A função strip_tags, embora adepta à remoção de tags HTML, não consegue lidar com caracteres especiais HTML incômodos, como para espaço inseparável ou © para o símbolo de copyright. Isso pode ser um obstáculo na criação de feeds RSS limpos.

Para solucionar esse problema, considere utilizar uma das seguintes estratégias:

  • Decodificação de entidade HTML: Use html_entity_decode para converter os códigos especiais de volta aos caracteres originais antes que sua string passe pelo processamento strip_tags.
  • Expressão regular Remoção: Como alternativa, empregue a função preg_replace para direcionar e remover esses caracteres diretamente de sua string. Aqui está um exemplo de padrão que realizará a tarefa:
$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);

Observe que o padrão acima inclui uma modificação sugerida por Jacco para evitar substituições não intencionais de caracteres e comerciais genuínos (&) em texto não codificado. Ao especificar um intervalo de caracteres de {2,8}, o padrão é mais discriminativo no direcionamento de códigos especiais HTML.

Declaração de lançamento Este artigo foi reimpresso em: 1729256054 Se houver alguma violação, entre em contato com [email protected] para excluí-lo
Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3