"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?

PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?

2024년 12월 22일에 게시됨
검색:763

How Can I Preserve HTML Tags When Extracting Nodes Using PHP's DOMDocument?

DOMDocument를 사용하여 HTML 노드 추출 관련 문제

소개

PHP 클래스인 DOMDocument는 구문 분석을 위한 편리한 접근 방식을 제공합니다. 그리고 HTML 문서를 조작합니다. 그러나 콘텐츠를 추출하는 동안 HTML 태그를 유지하려고 하면 사용자가 어려움을 겪을 수 있습니다. 이 문서에서는 DOM의 기본 개념을 자세히 살펴보고 이 문제를 해결하기 위한 솔루션을 제안합니다.

DOM 및 노드 이해

DOMDocument는 HTML 문서를 노드의 계층적 트리로 나타냅니다. 각 노드는 복잡한 구조를 형성하는 하위 노드를 가질 수 있습니다. 속성 및 텍스트 콘텐츠와 함께 HTML 요소가 모두 DOMDocument 내에서 노드로 표시된다는 점을 인식하는 것이 중요합니다.

태그 보존 문제 해결

제공된 코드는 "showContent" ID를 사용하여 DIV 노드를 성공적으로 가져옵니다. 그러나 HTML 태그 자체를 제외하고 DIV 내의 텍스트 콘텐츠만 검색합니다. 이는 코드가 실제 노드가 아닌 텍스트만 추출하는 $tag->nodeValue를 사용하기 때문입니다.

해결책: 노드 순회

HTML 노드를 유지하려면 대상 노드의 하위 노드를 순회해야 합니다. 아래 코드는 이 접근 방식을 보여줍니다.

$dom = new DOMDocument();
@$dom->loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('.//div[@id="showContent"]');
foreach ($tags as $tag) {
    echo $dom->saveXML($tag);
    echo '
'; }

HTML에서 특정 정보 검색

HTML 문서에서 테이블의 링크와 같은 특정 정보가 필요한 경우 XPath 쿼리를 수정하여 적절한 노드. 예를 들어:

foreach ($div->getElementsByTagName('a') as $link) {
    echo $dom->saveXML($link);
}

추가 리소스

DOMDocument 작업에 대한 추가 지원은 다음 리소스를 참조하세요.

  • [DOMDocument 문서](https ://www.php.net/manual/en/class.domdocument.php)
  • [질문과 답변 스택 오버플로의 DOM문서](https://stackoverflow.com/search?q=user:208809 DOM)
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3