So extrahieren Sie Informationen aus einer Schattenwurzel mit Selenium Python
Selenium bietet ein robustes Framework für die Webautomatisierung, einschließlich der Möglichkeit zum Extrahieren Informationen aus dynamisch geladenen Webelementen wie Schattenwurzeln. Dieser Leitfaden zeigt, wie Sie die Herausforderung meistern, Produktetiketten und andere Felder aus einem bestimmten Online-Shop innerhalb eines Schattenstamms zu extrahieren.
Die Herausforderung: Informationen aus einem Schattenstamm extrahieren
Wenn man auf Schattenwurzeln stößt, ist es notwendig, alternative Strategien für die Elementlokalisierung und -extraktion zu erkunden. Der herkömmliche XPath-Ansatz reicht möglicherweise nicht aus. Dieser Leitfaden stellt eine Lösung vor, die die Methodeexecute_script() von Selenium nutzt, um auf das Schattenstammverzeichnis zuzugreifen und die gewünschten Informationen abzurufen.
Lösung: Verwenden von ShadowRoot.querySelector()
To Um das Produktetikett zu extrahieren, verwenden Sie den folgenden Ansatz:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
Ausgabe:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
Fazit
Diese Lösung zeigt wie man mit Selenium Python effektiv Informationen aus einem Schattenstamm extrahiert und so eine zuverlässige Technik zur Automatisierung von Webinteraktionen selbst in anspruchsvollen Szenarien bietet.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3