"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > ¿Cómo extraer texto de etiquetas HTML específicas usando DomDocument y XPath?

¿Cómo extraer texto de etiquetas HTML específicas usando DomDocument y XPath?

Publicado el 2025-03-10
Navegar:501

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

analizando html con el domdocumento de PHP y xpath

al intentar analizar HTML utilizando el domdocumento de PHP, un problema común está encontrando texto específico dentro de las etiquetas de clases particulares. Uso de DomDocument :: GetElementsBytagName solo puede no ser suficiente en tales casos.

para capturar texto específico dentro de las etiquetas de una clase de destino, se recomienda un enfoque alternativo que utilice DOMDocument y DOMXPath. DomXPath permite que las consultas de XPath poderosas ubiquen elementos basados ​​en sus atributos y estructura.

Considere el siguiente html:

Capture this text 1
Capture this text 2

para recuperar el texto dentro de las etiquetas con class = "text" que son descendientes de las etiquetas con class = "main", siga estos pasos:

php
$html = 
    
Capture this text 1
Capture this text 2
HTML; $dom = new DOMDocument(); $dom->loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }

Este fragmento de código saldrá:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

utilizando DomDocument y DOMXPath, puede localizar y recuperar elementos con precisión dentro de una estructura HTML, incluso cuando se trata de jerarquías de clase específicas y requisitos de contenido.

Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3