Selenium Python を使用してシャドウ ルート内から情報を抽出する方法
Selenium は、Web 自動化のための堅牢なフレームワークを提供します。シャドウ ルートなど、動的に読み込まれる Web 要素からの情報。このガイドでは、シャドウ ルート内の特定のオンライン ストアから製品ラベルやその他のフィールドを抽出するという課題を克服する方法を説明します。
課題: シャドウ ルートからの情報の抽出
シャドウ ルートに遭遇した場合、要素の位置と抽出のための代替戦略を検討する必要があります。従来の XPath アプローチでは十分ではない可能性があります。このガイドでは、Selenium のexecute_script() メソッドを利用してシャドウ ルートにアクセスし、必要な情報を取得するソリューションを紹介します。
解決策: ShadowRoot.querySelector() を使用する
To製品ラベルを抽出するには、次のアプローチを使用します:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
出力:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
結論
このソリューションは次のことを示しますSelenium Python を使用してシャドウ ルート内から情報を効果的に抽出する方法を説明し、困難なシナリオでも Web インタラクションを自動化するための信頼できる技術を提供します。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3