PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?

첫 장 > 프로그램 작성 > PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?

PHP의 DOMDocument를 사용하여 노드를 추출할 때 HTML 태그를 어떻게 보존할 수 있습니까?

2024년 12월 22일에 게시됨

검색:196

How Can I Preserve HTML Tags When Extracting Nodes Using PHP's DOMDocument?

DOMDocument를 사용하여 HTML 노드 추출 관련 문제

소개

PHP 클래스인 DOMDocument는 구문 분석을 위한 편리한 접근 방식을 제공합니다. 그리고 HTML 문서를 조작합니다. 그러나 콘텐츠를 추출하는 동안 HTML 태그를 유지하려고 하면 사용자가 어려움을 겪을 수 있습니다. 이 문서에서는 DOM의 기본 개념을 자세히 살펴보고 이 문제를 해결하기 위한 솔루션을 제안합니다.

DOM 및 노드 이해

DOMDocument는 HTML 문서를 노드의 계층적 트리로 나타냅니다. 각 노드는 복잡한 구조를 형성하는 하위 노드를 가질 수 있습니다. 속성 및 텍스트 콘텐츠와 함께 HTML 요소가 모두 DOMDocument 내에서 노드로 표시된다는 점을 인식하는 것이 중요합니다.

태그 보존 문제 해결

제공된 코드는 "showContent" ID를 사용하여 DIV 노드를 성공적으로 가져옵니다. 그러나 HTML 태그 자체를 제외하고 DIV 내의 텍스트 콘텐츠만 검색합니다. 이는 코드가 실제 노드가 아닌 텍스트만 추출하는 $tag->nodeValue를 사용하기 때문입니다.

해결책: 노드 순회

HTML 노드를 유지하려면 대상 노드의 하위 노드를 순회해야 합니다. 아래 코드는 이 접근 방식을 보여줍니다.

$dom = new DOMDocument();
@$dom->loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('.//div[@id="showContent"]');
foreach ($tags as $tag) {
    echo $dom->saveXML($tag);
    echo '
';
}

HTML에서 특정 정보 검색

HTML 문서에서 테이블의 링크와 같은 특정 정보가 필요한 경우 XPath 쿼리를 수정하여 적절한 노드. 예를 들어:

foreach ($div->getElementsByTagName('a') as $link) {
    echo $dom->saveXML($link);
}

추가 리소스

DOMDocument 작업에 대한 추가 지원은 다음 리소스를 참조하세요.

[DOMDocument 문서](https ://www.php.net/manual/en/class.domdocument.php)
[질문과 답변 스택 오버플로의 DOM문서](https://stackoverflow.com/search?q=user:208809 DOM)

최신 튜토리얼 더>

regex를 사용하여 PHP에서 괄호 안에서 텍스트를 추출하는 방법
$ fullstring = "이 (텍스트)을 제외한 모든 것을 무시하는 것"; $ start = strpos ( ', $ fullstring); $ fullString); $ shortstring = substr ($ fulls...

프로그램 작성 2025-04-30에 게시되었습니다
오른쪽에서 CSS 배경 이미지를 찾는 방법은 무엇입니까?
/ 오른쪽에서 10px 요소를 배치하려면 / 배경 위치 : 오른쪽 10px 상단; 이 CSS 상단 코너는 오른쪽 상단의 왼쪽에서 10 pixels가되어야합니다. 요소의 상단 에지. 이 기능은 Internet Explorer 8 또는 이...

프로그램 작성 2025-04-30에 게시되었습니다
Fastapi Custom 404 페이지 제작 가이드
custom 404 fastapi 가없는 페이지를 찾을 수 없습니다. 적절한 방법은 특정 요구 사항에 따라 다릅니다. 404 상태 코드에서 리디렉션 response = await call_next(request) if response.sta...

프로그램 작성 2025-04-30에 게시되었습니다
오른쪽 테이블의 where 조항에서 필터링 할 때 왼쪽 결합이 연결된 이유는 무엇입니까?
다음 쿼리를 상상해보십시오 : select A.Foo, B. 바, c.foobar a로 테이블온에서 내부는 a.pk = b.fk에서 b로 tabletwo를 결합합니다 b.pk = c.fk에서 c as c로 왼쪽으로 결합하십시오 여기서 a.foo = '...

프로그램 작성 2025-04-30에 게시되었습니다
팬더에서 연도와 1/4 열을 하나의주기적인 열로 병합하는 방법은 무엇입니까?
새로운 기간 열에 대한 열을 연결하는 열 문제 문 : 라는 열이있는 pandas dataframe을 고려하십시오 : 분기 2000 Q2 2001 Q3 목표는 다음과 같은 결과를 얻기 위해 "연도"...

프로그램 작성 2025-04-30에 게시되었습니다
MySQLI로 전환 한 후 Codeigniter가 MySQL 데이터베이스에 연결 해야하는 이유
문제를 디버깅하려면 파일 끝에 다음 코드를 추가하고 출력을 검토하는 것이 좋습니다. echo ''; print_r ($ db ); echo ''; echo '데이터베이스에 연결 :'. $ db ; $ dbh = mysq...

프로그램 작성 2025-04-30에 게시되었습니다
유효한 코드에도 불구하고 PHP의 입력을 캡처하는 사후 요청이없는 이유는 무엇입니까?
post request 오작동 주소 php action='' action = "

프로그램 작성 2025-04-30에 게시되었습니다
$\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?$
\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?
를 해결하는 방법 "일반 오류 : 2006 MySQL Server가 사라졌습니다. 이 오류는 일반적으로 MySQL 구성의 두 변수 중 하나로 인해 서버에 대한 연결이 손실 될 때 발생합니다. 솔루션 : 이 오류를 해결하기위한 키는 Wait_Ti...

프로그램 작성 2025-04-30에 게시되었습니다
PYTZ가 처음에 예상치 못한 시간대 오프셋을 표시하는 이유는 무엇입니까?
import pytz pytz.timezone ( 'Asia/Hong_kong') std> discrepancy source 역사 전반에 걸쳐 변동합니다. PYTZ가 제공하는 기본 시간대 이름 및 오프...

프로그램 작성 2025-04-30에 게시되었습니다
Google API에서 최신 JQuery 라이브러리를 검색하는 방법은 무엇입니까?
https://code.jquery.com/jquery-latest.min.js (jQuery Hosted, Minified) https://code.jquery.com/jquery-latest.js (JQuery Hosted, Hosted, 비 압축) 압축...

프로그램 작성 2025-04-30에 게시되었습니다
FormData ()로 여러 파일 업로드를 처리하려면 어떻게해야합니까?
); 그러나이 코드는 첫 번째 선택된 파일 만 처리합니다. 파일 : var files = document.getElementById ( 'filetOUpload'). 파일; for (var x = 0; x

프로그램 작성 2025-04-30에 게시되었습니다
Firefox Back 버튼을 사용할 때 JavaScript 실행이 중단되는 이유는 무엇입니까?
원인 및 솔루션 : 이 동작은 브라우저 캐싱 자바 스크립트 리소스에 의해 발생합니다. 이 문제를 해결하고 후속 페이지 방문에서 스크립트가 실행되도록하기 위해 Firefox 사용자는 Window.onload 이벤트에서 호출되도록 빈 기능을 설정해야합니다. ...

프로그램 작성 2025-04-30에 게시되었습니다
Object-Fit : IE 및 Edge에서 표지가 실패, 수정 방법?
이 문제를 해결하기 위해 문제를 해결하는 영리한 CSS 솔루션을 사용합니다. -50%); 높이 : 100%; 너비 : 자동; // 수직 블록의 경우 높이 : 자동; 너비 : 100%; // 수평 블록의 경우 이 조합은 절대 포지셔닝을 사용하여 중앙에서 ...

프로그램 작성 2025-04-30에 게시되었습니다
프록시 서버 란 무엇입니까? 네트워크를 해독하는 중개인
프록시 서버 란 무엇입니까? 이 예를 고려하십시오. 여기서는 앨리스와 밥의 두 사람을 볼 수 있습니다. 중간에는 프록시가 있습니다. Alice는 대리에게 메시지를 전달 해달라고 요청했지만 Bob도 마찬가지입니다. 프록시는이 두 사람 사이에 ...

프로그램 작성 2025-04-30에 게시되었습니다
SQLALCHEMY 필터 조항에서 'Flake8'플래킹 부울 비교가 된 이유는 무엇입니까?
데이터베이스 테이블의 부울 필드 (Obsoleted)는 비 초소형 테스트 사례의 수를 결정하는 데 사용됩니다. 이 코드는 필터 절에서 테스트 케이스를 사용합니다. casenum = session.query (testcase) .filter (testcas...

프로그램 작성 2025-04-30에 게시되었습니다