克服 Python 請求的 Javascript 障礙
傳統的 Python 請求旨在從靜態 HTML 頁面中提取資訊。然而,許多現代網站使用 Javascript 來動態獲取數據,這給 Requests 帶來了挑戰。
是否有解決方法可以利用 Javascript 頁面的 Requests ?
絕對可以!解決方案在於採用“requests-html”模組。這個專門的函式庫與 Requests 無縫集成,支援即時無縫執行 Javascript。
實作範例:
from requests_html import HTMLSession
# Initialize an HTML session
session = HTMLSession()
# Retrieve the Javascript-infused page
r = session.get('http://www.yourjspage.com')
# Execute Javascript calls through "render"
r.html.render()
# Access HTML elements with ease
result = r.html.find('#myElementID').text
此增強方法消除了手動操作 Javascript 程式碼的需求。此外,該程式庫封裝了BeautifulSoup,提供了熟悉的HTML操作方法,例如:
r.html.find('#myElementID').text
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3