Python 요청에 대한 Javascript 장애물 극복
기존 Python 요청은 정적 HTML 페이지에서 정보를 추출하도록 설계되었습니다. 그러나 많은 최신 웹사이트에서는 Javascript를 사용하여 동적으로 데이터를 가져오므로 요청에 대한 문제가 발생합니다.
Javascript가 많은 페이지에서 요청을 활용할 수 있는 해결 방법이 있습니까?
물론입니다! 해결책은 "requests-html" 모듈을 수용하는 데 있습니다. 이 전문 라이브러리는 요청과 원활하게 통합되어 즉석에서 원활한 Javascript 실행을 가능하게 합니다.
구현 예:
from requests_html import HTMLSession
# Initialize an HTML session
session = HTMLSession()
# Retrieve the Javascript-infused page
r = session.get('http://www.yourjspage.com')
# Execute Javascript calls through "render"
r.html.render()
# Access HTML elements with ease
result = r.html.find('#myElementID').text
이 향상된 방법을 사용하면 Javascript 코드를 수동으로 조작할 필요가 없습니다. 또한 라이브러리는 BeautifulSoup을 캡슐화하여 다음과 같은 친숙한 HTML 조작 방법을 제공합니다.
r.html.find('#myElementID').text
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3