Lorsque vous essayez de gratter une page Web à l'aide de htmlagilitypack, vous pouvez rencontrer des divergences dans les données récupérées en raison de la présence de Javascrip et remplit la page. Cela soulève la question: comment gérer les scripts qui doivent être exécutés pour obtenir les données souhaitées?
Malheureusement, HTMLagilityPack est uniquement un analyseur HTML et n'a pas la capacité d'interpréter ou de lier JavaScript à sa représentation de document. Pour résoudre ce problème, nous avons besoin d'un navigateur Web complet sans tête, équipé d'un analyseur HTML, d'un interprète JavaScript et d'un simulateur DOM du navigateur. Cependant, il n'y a actuellement aucune solution qui fonctionne entièrement dans l'environnement .NET.
L'approche pratique consiste à utiliser un contrôle WebBrowser pour charger et exécuter la page dans Internet Explorer par programme. Bien que cette méthode puisse ne pas être efficace ou esthétique, elle atteint l'objectif souhaité de récupérer des données qui nécessitent l'exécution du script.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3