Comment extraire du texte à partir de balises HTML spécifiques à l'aide de DomDocument et XPATH?

Page de garde > La programmation > Comment extraire du texte à partir de balises HTML spécifiques à l'aide de DomDocument et XPATH?

Comment extraire du texte à partir de balises HTML spécifiques à l'aide de DomDocument et XPATH?

Publié le 2025-03-10

Parcourir:308

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

analysant html avec DomDocument de Php et xpath

lorsque vous essayez de analyser HTML à l'aide de DomDocument de Php, un problème commun consiste à trouver du texte spécifique dans des tonnes de classes particulières. L'utilisation de DomDocument :: GetElementsByTagName seule peut ne pas suffire dans de tels cas.

pour capturer du texte spécifique dans les balises d'une classe cible, une approche alternative utilisant DomDocument et Domxpath est recommandée. Domxpath permet aux requêtes XPath puissantes de localiser des éléments en fonction de leurs attributs et de leur structure.

Considérez le html suivant:


    
    Capture this text 1
    



    
    Capture this text 2

Pour récupérer le texte dans les balises

avec class = "text" qui sont des descendants des

tags avec class = "main", suivez ces étapes:

php
$html = 
    
    Capture this text 1

Capture this text 2

HTML; $dom = new DOMDocument(); $dom->loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }

Cet extrait de code sortira:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

En utilisant DomDocument et Domxpath, vous pouvez localiser et récupérer avec précision les éléments dans une structure HTML, même lorsque vous traitez des hiérarchies de classe et des exigences de contenu spécifiques.

Dernier tutoriel Plus>

$Pourquoi la demande de postn \ 'ne capture-t-elle pas d'entrée en PHP malgré le code valide?$
Pourquoi la demande de postn \ 'ne capture-t-elle pas d'entrée en PHP malgré le code valide?
Adresses du post Demande Dysfonctionnement en php Dans l'extrait de code présenté: "Méthode =" post "> " ...

La programmation Publié le 2025-03-10
Comment définir dynamiquement les touches dans les objets JavaScript?
Comment créer une clé dynamique pour une variable d'objet JavaScript lorsque vous essayez de créer une clé dynamique pour un objet JavaScrip...

La programmation Publié le 2025-03-10
Comment pouvez-vous utiliser des données de groupe par pour pivoter dans MySQL?
Pivoting des résultats de la requête en utilisant le groupe mysql par Dans une base de données relationnelle, les données pivotant se réfèrent...

La programmation Publié le 2025-03-10
Comment résoudre les écarts de chemin du module dans GO Mod en utilisant la directive Remplacer?
surmonter la divergence du chemin du module dans go mod Lors de l'utilisation de Go Mod, il est possible de rencontrer un conflit où un pa...

La programmation Publié le 2025-03-10
Pourquoi l'exécution de JavaScript cesse-t-elle lors de l'utilisation du bouton Firefox Retour?
Problème d'histoire de la navigation: JavaScript cesse d'exécuter après avoir utilisé le bouton de retour de Firefox Les utilisateurs ...

La programmation Publié le 2025-03-10
Comment limiter la plage de défilement d'un élément dans un élément parent de taille dynamique?
Implémentation de limites de hauteur CSS pour les éléments de défilement vertical dans une interface interactive, le contrôle du comportement ...

La programmation Publié le 2025-03-10
Comment récupérer efficacement la dernière ligne pour chaque identifiant unique dans PostgreSQL?
PostgreSQL: Extraction de la dernière ligne pour chaque identifiant unique Dans PostgreSql, vous pouvez rencontrer des situations de données o...

La programmation Publié le 2025-03-10
Comment réparer « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion de données ?
Comment résoudre « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion d'enregistrementsIntroduction :L'insertion de d...

La programmation Publié le 2025-03-10
Comment insérer correctement les blobs (images) dans MySQL à l'aide de PHP?
Insérez des blobs dans les bases de données MySQL avec PHP Lorsque vous essayez de stocker une image dans une base de données MySQL, vous pou...

La programmation Publié le 2025-03-10
Comment vérifier si un objet a un attribut spécifique dans Python?
Méthode pour déterminer l'existence de l'attribut d'objet Cette enquête cherche une méthode pour vérifier la présence d'un att...

La programmation Publié le 2025-03-10
Comment supprimer proprement les gestionnaires d'événements JavaScript anonymes?
supprimer les auditeurs d'événements anonymes Ajouter des auditeurs d'événements anonymes aux éléments offre une flexibilité et une simp...

La programmation Publié le 2025-03-10
Pourquoi est-ce que je reçois MySQL Error # 1089: clé de préfixe incorrect?
MySql Error # 1089: Key de préfixe incorrect Les utilisateurs de MySQL peuvent rencontrer du code d'erreur # 1089, indiquant une utilisati...

La programmation Publié le 2025-03-10
Comment extraire un élément aléatoire d'un tableau en PHP?
sélection aléatoire à partir d'un tableau en php, l'obtention d'un élément aléatoire à partir d'un tableau peut être accompli av...

La programmation Publié le 2025-03-10
Y a-t-il une différence de performance entre l'utilisation d'une boucle for-out et un itérateur pour la traversée de collecte en Java?
pour chaque boucle vs iterator: efficacité dans la collection Traversal introduction Lorsque vous traversez une collection dans Java, le c...

La programmation Publié le 2025-03-10
Anomalies de valeur clé du tableau PHP: Comprendre le cas curieux de 07 et 08
Problème de valeur de clé du tableau php avec 07 & 08 Un tableau contient divers éléments avec des touches associées. Dans PHP, un problème in...

La programmation Publié le 2025-03-10

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article