如何使用 Selenium 从影子根中提取信息 Python
Selenium 为 Web 自动化提供了一个强大的框架,包括提取信息的能力来自动态加载的 Web 元素(例如影子根)的信息。本指南将演示如何克服从影子根中的特定在线商店提取产品标签和其他字段的挑战。
挑战:从影子根中提取信息
当遇到影子根时,有必要探索元素定位和提取的替代策略。传统的 XPath 方法可能不够。本指南提供了一个利用 Selenium 的 execute_script() 方法来访问影子根并检索所需信息的解决方案。
解决方案:使用 ShadowRoot.querySelector()
To提取产品标签,使用以下方法:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
输出:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
结论
此解决方案演示如何使用 Selenium Python 有效地从影子根中提取信息,即使在具有挑战性的场景中也能提供可靠的自动化 Web 交互技术。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3