"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > Comment extraire du texte à partir de balises HTML spécifiques à l'aide de DomDocument et XPATH?

Comment extraire du texte à partir de balises HTML spécifiques à l'aide de DomDocument et XPATH?

Publié le 2025-03-10
Parcourir:308

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

analysant html avec DomDocument de Php et xpath

lorsque vous essayez de analyser HTML à l'aide de DomDocument de Php, un problème commun consiste à trouver du texte spécifique dans des tonnes de classes particulières. L'utilisation de DomDocument :: GetElementsByTagName seule peut ne pas suffire dans de tels cas.

pour capturer du texte spécifique dans les balises d'une classe cible, une approche alternative utilisant DomDocument et Domxpath est recommandée. Domxpath permet aux requêtes XPath puissantes de localiser des éléments en fonction de leurs attributs et de leur structure.

Considérez le html suivant:

Capture this text 1
Capture this text 2

Pour récupérer le texte dans les balises

avec class = "text" qui sont des descendants des
tags avec class = "main", suivez ces étapes:
php
$html = 
    
Capture this text 1
Capture this text 2
HTML; $dom = new DOMDocument(); $dom->loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }

Cet extrait de code sortira:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

En utilisant DomDocument et Domxpath, vous pouvez localiser et récupérer avec précision les éléments dans une structure HTML, même lorsque vous traitez des hiérarchies de classe et des exigences de contenu spécifiques.

Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3