「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > domdocumentとxpathを使用して特定のHTMLタグからテキストを抽出する方法は?

domdocumentとxpathを使用して特定のHTMLタグからテキストを抽出する方法は?

2025-03-10に投稿されました
ブラウズ:738

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

をphpのdomdocumentとxpath

with phpのdomdocumentを使用して解析しようとするとき、共通の問題は特定のクラスのタグ内で特定のテキストを見つけることです。 domdocument :: getelementsbytagnameのみでは、そのような場合は十分ではない場合があります。 DomxPathでは、強力なXpathクエリが属性と構造に基づいて要素を見つけることができます。

このテキストをキャプチャ1
このテキストをキャプチャ2

タグ内のテキストを取得するには、class = "main"の
タグの子孫であるclass = "テキスト"を取得します。 $ html =
このテキストをキャプチャ1
このテキストをキャプチャ2
HTML; $ dom = new domdocument(); $ dom-> loadhtml($ html); $ xpath = new DomxPath($ dom); $ tags = $ xpath-> query( '// div [@class = "main"]/div [@class = "text"]'); foreach($ tags as $ tag){ var_dump(trim($ tag-> nodevalue)); }

このコードスニペットは出力されます:

Capture this text 1
Capture this text 2

domdocumentとdomxpathを使用して、特定のクラスの階層とコンテンツ要件を扱う場合でも、HTML構造内の要素を正確に見つけて取得できます。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3