Wenn Sie versuchen, eine Webseite mithilfe von htmlagilitypack zu kratzen, können Sie in den abgerufenen Daten aufgrund der Präsenz von Javascript, die dynamisch auf Diskrepanzen stoßen, die dynamisch abgerufen werden, dynamisch abgerufen werden, die dynamisch abgerufen werden, dynamisch abgerufen werden. und bevölkert die Seite. Dies wirft die Frage auf: Wie können wir mit Skripten umgehen, die ausgeführt werden müssen, um die gewünschten Daten zu erhalten?
Leider ist HtmlagilityPack ausschließlich ein HTML -Parser und fehlt die Fähigkeit, JavaScript an seine Dokumentenrepräsentation zu interpretieren oder zu binden. Um dieses Problem zu beheben, erfordern wir einen vollständigen Kopfbrowser, der mit einem HTML -Parser, einem JavaScript -Dolmetscher und einem Browser -Dom -Simulator ausgestattet ist. Derzeit gibt es jedoch keine Lösung, die in der .NET -Umgebung vollständig arbeitet.
Der praktische Ansatz beinhaltet die Verwendung einer Webbrowser -Steuerung zum Laden und Ausführen der Seite im Internet Explorer programmgesteuert. Diese Methode ist zwar nicht effizient oder ästhetisch ansprechend, aber sie erreicht das gewünschte Ziel, Daten abzurufen, die eine Skriptausführung erfordern.
.Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3