интегрировать селен с Scrapy для динамического скребки страниц
При попытке соскрести данные из динамических веб -страниц с использованием Scrapy, стандартный процесс ползания может прервать. Это часто относится к тому, что странификация опирается на асинхронную загрузку, например, нажатие на кнопку «Далее», которая не изменяет URL. Чтобы преодолеть эту проблему, включение селена в ваш Scrapy Spider может быть эффективным решением.
. Однако несколько общих подходов включают в себя:]
Inside Parse () Метод:Этот подход включает в себя использование Selenium в методе Parse () вашего паука для обработки лиц и извлечения данных для каждой страницы. Это выполняет лиц, прежде чем передавать ответ на метод Parse () Spider's Parse ().
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3