Cómo extraer información desde una raíz de sombra usando Selenium Python
Selenium proporciona un marco sólido para la automatización web, incluida la capacidad de extraer información de elementos web cargados dinámicamente, como raíces de sombra. Esta guía demostrará cómo superar el desafío de extraer etiquetas de productos y otros campos de una tienda en línea específica dentro de una raíz oculta.
El desafío: extraer información de una raíz oculta
Al encontrar raíces de sombra, es necesario explorar estrategias alternativas para la ubicación y extracción de elementos. Es posible que el enfoque XPath convencional no sea suficiente. Esta guía presenta una solución que aprovecha el método ejecutar_script() de Selenium para acceder a la raíz oculta y recuperar la información deseada.
Solución: uso de ShadowRoot.querySelector()
Para extraiga la etiqueta del producto, utilice lo siguiente enfoque:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
Salida:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
Conclusión
Esta solución demuestra cómo extraer información de manera efectiva desde una raíz oculta usando Selenium Python, proporcionando una técnica confiable para automatizar las interacciones web incluso en escenarios desafiantes.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3