Comment extraire des informations d'une racine fantôme à l'aide de Selenium Python
Selenium fournit un cadre robuste pour l'automatisation Web, y compris la possibilité d'extraire informations provenant d’éléments Web chargés dynamiquement tels que les racines fantômes. Ce guide montrera comment surmonter le défi lié à l'extraction des étiquettes de produits et d'autres champs d'une boutique en ligne spécifique au sein d'une racine fantôme.
Le défi : extraire des informations d'une racine fantôme
Lorsque vous rencontrez des racines fantômes, il devient nécessaire d'explorer des stratégies alternatives pour la localisation et l'extraction des éléments. L'approche XPath conventionnelle peut ne pas suffire. Ce guide présente une solution qui exploite la méthode execute_script() de Selenium pour accéder à la racine fantôme et récupérer les informations souhaitées.
Solution : Utilisation de ShadowRoot.querySelector()
Pour Extrayez l'étiquette du produit, utilisez les éléments suivants approche :
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
Sortie :
La especial mezcla de nueces, maní, almendras y marañones x 450 g
Conclusion
Cette solution démontre comment extraire efficacement des informations d'une racine fantôme à l'aide de Selenium Python, fournissant une technique fiable pour automatiser les interactions Web, même dans des contextes difficiles scénarios.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3