"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 태그를 제거하기 전에 완고한 HTML 특수 문자를 제거하는 방법은 무엇입니까?

태그를 제거하기 전에 완고한 HTML 특수 문자를 제거하는 방법은 무엇입니까?

2024-11-08에 게시됨
검색:308

How to Remove Stubborn HTML Special Characters Before Stripping Tags?

완고한 HTML 특수 문자 제거

strip_tags 함수는 HTML 태그 제거에 능숙하지만 다음과 같은 성가신 HTML 특수 문자를 처리하지 못합니다. 줄 바꿈 없는 공백의 경우 또는 저작권 기호의 경우 ©입니다. 이는 깨끗한 RSS 피드를 만드는 데 걸림돌이 될 수 있습니다.

이 문제를 해결하려면 다음 전략 중 하나를 활용하는 것을 고려하세요.

  • HTML 엔터티 디코딩: 문자열이 Strip_tags 처리를 거치기 전에 html_entity_decode를 사용하여 특수 코드를 원래 문자로 다시 변환하십시오.
  • 정규 표현식 제거: 또는 preg_replace 함수를 사용하여 이러한 문자를 대상으로 지정하고 제거하십시오. 끈. 다음은 작업을 수행하는 샘플 패턴입니다.
$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);

위 패턴에는 인코딩되지 않은 텍스트에서 실제 앰퍼샌드 문자(&)가 의도치 않게 교체되는 것을 방지하기 위해 Jacco가 제안한 수정 사항이 포함되어 있습니다. 문자 범위를 {2,8}로 지정하면 HTML 특수 코드를 타겟팅할 때 패턴이 더욱 구별됩니다.

릴리스 선언문 이 글은 1729256054에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3