Selenium Python을 사용하여 섀도우 루트 내에서 정보를 추출하는 방법
Selenium은 추출 기능을 포함하여 웹 자동화를 위한 강력한 프레임워크를 제공합니다. 섀도우 루트와 같이 동적으로 로드된 웹 요소의 정보. 이 가이드는 섀도우 루트 내의 특정 온라인 상점에서 제품 라벨 및 기타 필드를 추출하는 문제를 극복하는 방법을 보여줍니다.
과제: 섀도우 루트에서 정보 추출
그림자 루트를 발견하면 요소 위치 및 추출을 위한 대체 전략을 탐색해야 합니다. 기존의 XPath 접근 방식으로는 충분하지 않을 수 있습니다. 이 가이드는 Selenium의 Execute_script() 메서드를 활용하여 섀도우 루트에 액세스하고 원하는 정보를 검색하는 솔루션을 제시합니다.
해결책: ShadowRoot.querySelector() 사용
To 제품 라벨을 추출하려면 다음 접근 방식을 활용하세요.
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
출력:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
결론
이 솔루션은 다음을 보여줍니다. Selenium Python을 사용하여 섀도우 루트 내에서 정보를 효과적으로 추출하는 방법을 제공하며 까다로운 시나리오에서도 웹 상호 작용을 자동화하는 안정적인 기술을 제공합니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3