克服 Python 请求的 Javascript 障碍
传统的 Python 请求旨在从静态 HTML 页面中提取信息。然而,许多现代网站使用 Javascript 来动态获取数据,这给 Requests 带来了挑战。
是否有一种解决方法可以利用 Javascript 页面的 Requests ?
绝对可以!解决方案在于采用“requests-html”模块。这个专门的库与 Requests 无缝集成,支持即时无缝执行 Javascript。
实现示例:
from requests_html import HTMLSession
# Initialize an HTML session
session = HTMLSession()
# Retrieve the Javascript-infused page
r = session.get('http://www.yourjspage.com')
# Execute Javascript calls through "render"
r.html.render()
# Access HTML elements with ease
result = r.html.find('#myElementID').text
此增强方法消除了手动操作 Javascript 代码的需要。此外,该库封装了BeautifulSoup,提供了熟悉的HTML操作方法,例如:
r.html.find('#myElementID').text
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3