"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > Comment extraire des informations d'une racine fantôme à l'aide de Selenium Python ?

Comment extraire des informations d'une racine fantôme à l'aide de Selenium Python ?

Publié le 2024-11-16
Parcourir:568

How to Extract Information from within a Shadow Root Using Selenium Python?

Comment extraire des informations d'une racine fantôme à l'aide de Selenium Python

Selenium fournit un cadre robuste pour l'automatisation Web, y compris la possibilité d'extraire informations provenant d’éléments Web chargés dynamiquement tels que les racines fantômes. Ce guide montrera comment surmonter le défi lié à l'extraction des étiquettes de produits et d'autres champs d'une boutique en ligne spécifique au sein d'une racine fantôme.

Le défi : extraire des informations d'une racine fantôme

Lorsque vous rencontrez des racines fantômes, il devient nécessaire d'explorer des stratégies alternatives pour la localisation et l'extraction des éléments. L'approche XPath conventionnelle peut ne pas suffire. Ce guide présente une solution qui exploite la méthode execute_script() de Selenium pour accéder à la racine fantôme et récupérer les informations souhaitées.

Solution : Utilisation de ShadowRoot.querySelector()

Pour Extrayez l'étiquette du produit, utilisez les éléments suivants approche :

driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)

Sortie :

La especial mezcla de nueces, maní, almendras y marañones x 450 g

Conclusion

Cette solution démontre comment extraire efficacement des informations d'une racine fantôme à l'aide de Selenium Python, fournissant une technique fiable pour automatiser les interactions Web, même dans des contextes difficiles scénarios.

Déclaration de sortie Cet article est réimprimé à l'adresse : 1729291215. En cas d'infraction, veuillez contacter [email protected] pour le supprimer.
Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3