Python リクエストの Javascript 障害の克服
従来の Python リクエストは、静的 HTML ページから情報を抽出するように設計されています。ただし、最近の Web サイトの多くは Javascript を使用してデータを動的に取得するため、リクエストに課題が生じています。
JavaScript を多用するページでリクエストを利用するための回避策はありますか?
もちろんです。解決策は、「requests-html」モジュールを採用することです。この特殊なライブラリはリクエストとシームレスに統合され、オンザフライでシームレスな Javascript の実行を可能にします。
実装例:
from requests_html import HTMLSession
# Initialize an HTML session
session = HTMLSession()
# Retrieve the Javascript-infused page
r = session.get('http://www.yourjspage.com')
# Execute Javascript calls through "render"
r.html.render()
# Access HTML elements with ease
result = r.html.find('#myElementID').text
この拡張メソッドにより、JavaScript コードを手動で操作する必要がなくなります。さらに、ライブラリは BeautifulSoup をカプセル化し、
r.html.find('#myElementID').text
などの使い慣れた HTML 操作メソッドを提供します。 免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3