analizando html con el domdocumento de PHP y xpath
al intentar analizar HTML utilizando el domdocumento de PHP, un problema común está encontrando texto específico dentro de las etiquetas de clases particulares. Uso de DomDocument :: GetElementsBytagName solo puede no ser suficiente en tales casos.
para capturar texto específico dentro de las etiquetas de una clase de destino, se recomienda un enfoque alternativo que utilice DOMDocument y DOMXPath. DomXPath permite que las consultas de XPath poderosas ubiquen elementos basados en sus atributos y estructura.
Considere el siguiente html:
Capture this text 1Capture this text 2
para recuperar el texto dentro de las etiquetas
php $html =Capture this text 1HTML; $dom = new DOMDocument(); $dom->loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }Capture this text 2
Este fragmento de código saldrá:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
utilizando DomDocument y DOMXPath, puede localizar y recuperar elementos con precisión dentro de una estructura HTML, incluso cuando se trata de jerarquías de clase específicas y requisitos de contenido.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3