如何使用Selenium 從影子根中提取資訊Python
Selenium 為Web 自動化提供了一個強大的框架,包括提取資訊的能力來自動態載入的Web 元素(例如影子根)的資訊。本指南將示範如何克服從影子根中的特定線上商店提取產品標籤和其他欄位的挑戰。
挑戰:從影子根中提取資訊
當遇到影子根時,有必要探索元素定位和提取的替代策略。傳統的 XPath 方法可能不夠。本指南提供了一個利用 Selenium 的 execute_script() 方法來存取影子根並檢索所需資訊的解決方案。
解決方案:使用ShadowRoot.querySelector()
To提取產品標籤,利用以下內容方法:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
輸出:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
結論
此解決方案示範如何使用Selenium Python 有效地從影子根中提取訊息,為自動化Web互動提供可靠的技術,即使在具有挑戰性的場景。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3