使用PHP的DOMDocument擷取節點時如何保留HTML標籤？

首頁 > 程式設計 > 使用PHP的DOMDocument擷取節點時如何保留HTML標籤？

使用PHP的DOMDocument擷取節點時如何保留HTML標籤？

發佈於2024-12-22

How Can I Preserve HTML Tags When Extracting Nodes Using PHP's DOMDocument?

使用DOMDocument 提取HTML 節點的問題

簡介

DOMDocument 是PHP 類，提供了一種便捷的解析方法以及操作HTML 文件。然而，當嘗試在提取內容時保留 HTML 標籤時，使用者可能會遇到困難。本文深入探討了 DOM 的基本概念，並提出了應對這項挑戰的解決方案。

理解 DOM 和節點

DOMDocument 將 HTML 文件表示為節點的分層樹。每個節點可以有子節點，形成複雜的結構。認識到 HTML 元素及其屬性和文字內容都表示為 DOMDocument 中的節點至關重要。

解決標籤保留問題

提供的程式碼成功取得具有「showContent」id 的 DIV 節點。但是，它僅檢索 DIV 中的文字內容，不包括 HTML 標記本身。這是因為程式碼使用了$tag->nodeValue，它只提取文字而不是實際的節點。

解決方案：遍歷節點

要保留 HTML 節點，您需要遍歷目標節點的子節點。下面的程式碼展示了這個方法：

$dom = new DOMDocument();
@$dom->loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('.//div[@id="showContent"]');
foreach ($tags as $tag) {
    echo $dom->saveXML($tag);
    echo '
';
}

從HTML 檢索特定資訊

如果您需要來自HTML 文件的特定資訊（例如表中的連結），您可以修改XPath 查詢以選擇適當的節點。例如：

foreach ($div->getElementsByTagName('a') as $link) {
    echo $dom->saveXML($link);
}

其他資源

其他資源

有關使用DOMDocument 的更多協助，請參閱以下資源：

[DOMDocument 文件](https : //www.php.net/manual/en/class.domdocument.php)

How Can I Preserve HTML Tags When Extracting Nodes Using PHP's DOMDocument? [問題與解答Stack Overflow中的 DOMDocument](https://stackoverflow.com/search?q=user:208809 DOM)

最新教學更多>

JavaScript精準檢測瀏覽器及版本方法
在JavaScript 中瀏覽器檢測確定使用JavaScript的精確瀏覽器和版本可用於各種目的，例如根據用戶的Browser's Browserserserserserserser offerience ofertives。以下是可以實現的：該函數首先使用正則表達式將通用瀏覽器簽名和版...

程式設計發佈於2025-04-29
查找當前執行JavaScript的腳本元素方法
如何引用當前執行腳本的腳本元素在某些方案中理解問題在某些方案中，開發人員可能需要將其他腳本動態加載其他腳本。但是，如果Head Element尚未完全渲染，則使用document.getElementsbytagname（'head'）[0] .appendChild（v）的常規方...

程式設計發佈於2025-04-29
如何在php中使用捲髮發送原始帖子請求？
如何使用php 創建請求來發送原始帖子請求，開始使用curl_init（）開始初始化curl session。然後，配置以下選項： curlopt_url：請求 [要發送的原始數據指定內容類型，為原始的帖子請求指定身體的內容類型很重要。在這種情況下，它是文本/平原。要執行此操作，請使用包含以下標頭...

程式設計發佈於2025-04-29
如何在其容器中為DIV創建平滑的左右CSS動畫？
通用CSS動畫，用於左右運動，我們將探索創建一個通用的CSS動畫，以向左和右移動DIV，從而到達其容器的邊緣。該動畫可以應用於具有絕對定位的任何div，無論其未知長度如何。問題：使用左直接導致瞬時消失更加流暢的解決方案：混合轉換和左 [並實現平穩的，線性的運動，我們介紹了線性的轉換。...

程式設計發佈於2025-04-29
如何配置Pytesseract以使用數字輸出的單位數字識別？
Pytesseract OCR具有單位數字識別和僅數字約束在pytesseract的上下文中，在配置tesseract以識別單位數字和限制單個數字和限制輸出對數字可能會提出質疑。 To address this issue, we delve into the specifics of Te...

程式設計發佈於2025-04-29
如何簡化PHP中的JSON解析以獲取多維陣列？
php 試圖在PHP中解析JSON數據的JSON可能具有挑戰性，尤其是在處理多維數組時。要簡化過程，建議將JSON作為數組而不是對象解析。執行此操作，將JSON_DECODE函數與第二個參數設置為true：[&&&&& && &&&&& json = JSON = JSON_DECODE（$ ...

程式設計發佈於2025-04-29
在JavaScript中如何在函數內部獲取函數名稱？
如何在函數本身中檢索函數的名稱？內部確定函數名稱可用於調試或動態操作。要實現這一目標，請考慮以下方法：ES6：採用正則模式，如nus所建議：

程式設計發佈於2025-04-29
Java為何無法創建泛型數組？
通用陣列創建錯誤 arrayList [2]; JAVA報告了“通用數組創建”錯誤。為什麼不允許這樣做？答案：Create an Auxiliary Class:public static ArrayList<myObject>[] a = new ArrayList<my...

程式設計發佈於2025-04-29
解決MySQL錯誤1153：數據包超出'max_allowed_packet'限制
mysql錯誤1153：故障排除比“ max_allowed_packet” bytes 更大的數據包，用於面對陰謀mysql錯誤1153，同時導入數據capase doft a Database dust？讓我們深入研究罪魁禍首並探索解決方案以糾正此問題。理解錯誤此錯誤表明在導入過程中...

程式設計發佈於2025-04-29
如何在Java字符串中有效替換多個子字符串？
在java 中有效地替換多個substring，需要在需要替換一個字符串中的多個substring的情況下，很容易求助於重複應用字符串的刺激力量。 However, this can be inefficient for large strings or when working with nu...

程式設計發佈於2025-04-29
C++20 Consteval函數中模板參數能否依賴於函數參數？
[ consteval函數和模板參數依賴於函數參數在C 17中，模板參數不能依賴一個函數參數，因為編譯器仍然需要對非contexexpr futcoriations contim at contexpr function進行評估。 compile time。 C 20引入恆定函數，必須在編譯時進...

程式設計發佈於2025-04-29
在Java中如何將日期增加一天？
如何在一天中增加日期？當您需要一天中調整特定日期時，有幾種方法可用。 &&&&& &&&&&&dat dt = new Date（）; 日曆c = calendar.getInstance（）; C.SETTIME（dt）； c.add（日曆。日期，1）; dt = c.getTime();S...

程式設計發佈於2025-04-29
如何從PHP中的數組中提取隨機元素？
從陣列中的隨機選擇，可以輕鬆從數組中獲取隨機項目。考慮以下數組：; 從此數組中檢索一個隨機項目，利用array_rand（ array_rand（）函數從數組返回一個隨機鍵。通過將$項目數組索引使用此鍵，我們可以從數組中訪問一個隨機元素。這種方法為選擇隨機項目提供了一種直接且可靠的方法。

程式設計發佈於2025-04-29
在Java中如何為PNG文件添加坐標軸和標籤？
如何用java 在現有png映像中添加軸和標籤的axes和labels如何註釋png文件可能具有挑戰性。與其嘗試可能導致錯誤和不一致的修改，不如建議在圖表創建過程中集成註釋。使用JFReechArt import java.awt.color; 導入java.awt.eventqueue; 導...

程式設計發佈於2025-04-29
如何使用替換指令在GO MOD中解析模塊路徑差異？
在使用GO MOD時，在GO MOD 中克服模塊路徑差異時，可能會遇到衝突，其中可能會遇到一個衝突，其中3派對軟件包將另一個帶有導入套件的path package the Imptioned package the Imptioned package the Imported tocted pac...

程式設計發佈於2025-04-29