"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Como extrair texto de tags HTML específicas usando DomDocument e XPath?

Como extrair texto de tags HTML específicas usando DomDocument e XPath?

Postado em 2025-03-10
Navegar:662

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

analisando html com o DomDocument e xpath

ao tentar analisar as classes específicas de html do PHP, um problema comum é encontrar um texto específico em tags de classes específicas. Usando o DomDocument :: GetElementsByTagName sozinho pode não ser suficiente nesses casos. O DomXPath permite que consultas xpath poderosas localizem elementos com base em seus atributos e estrutura.

Capture este texto 1
Capture este texto 2

para recuperar o texto nas tags

com class = "text" que são descendentes das tags
com class = "main", siga estas etapas:

$ html =

Capture este texto 1
Capture este texto 2
Html; $ dom = new DomDocument (); $ dom-> loadHtml ($ html); $ xpath = new DomXPath ($ dom); $ tags = $ xpath-> Query ('// div [@class = "main"]/div [@class = "text"]'); foreach ($ tags como $ tag) { var_dump (Trim ($ tag-> nodEvalue)); }
Capture this text 1
Capture this text 2

string 'Capture este texto 1' (comprimento = 19) String 'Capture este texto 2' (Length = 19)

php
$html = 
    
Capture this text 1
Capture this text 2
HTML; $dom = new DOMDocument(); $dom->loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }
Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3