Question

В моем пауке у меня есть такой код:

next_page_url = response.follow(
    url=self.start_urls[0][:-1]+str(page_number+1),
    callback=self.next_page
)

if next_page_url:

next_page выглядит так:

def next_page(self, response):
        next_page_count = len(<xpath I use>)
        if next_page_count > 0:
            return True
        else:
            return False

Мне нужно установить next_page_url, прежде чем я смогу продолжить следующий сегменткода. Этот код по существу проверяет, является ли текущая страница последней страницей для некоторых целей записи файла

obsidian93 · Answer 1 · 07 ноября 2019

В итоге я получил ответ:

вместо проверки, существует ли следующая страница, а затем продолжения по текущему запросу, я сделал запрос на странице, проверил, получил ли я ответ, и если янет, я сказал, что предыдущая страница была последней.

Я сделал это, используя ключевое слово meta в библиотеке запросов scrapy (response.follow()), чтобы передать необходимые данные отслеживания текущей страницы вновый запрос

Как заставить scrapy ждать результата запроса, прежде чем перейти к следующей строке

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как заставить scrapy ждать результата запроса, прежде чем перейти к следующей строке

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов