Реализовать очистку страницы кусками в Scrapy Python - PullRequest
0 голосов
/ 10 января 2020

Я пытаюсь очистить страницу в Scrapy, но порциями. Цель состоит в том, чтобы просто прочитать заголовок страницы, а не всю страницу.

Пример. Если у меня размер страницы 150 КБ, но я просто хотел прочитать заголовок, который должен быть в верхней части и размером менее 10 КБ, поэтому, если я прочту первую часть, я найду заголовок и просто отменим оставшуюся проверку страницы.

Возможно ли реализовать что-то в Scrapy, так что читайте страницу кусками?

1 Ответ

1 голос
/ 19 февраля 2020

Scrapy в настоящее время не поддерживает остановку чтения ответа до его завершения.

Возможно, вы захотите отследить некоторые связанные запросы существующих функций:

Может также иметь смысл создать новый запрос функции, который фокусируется на вашем сценарии, так как вы хотите прекратить читать ответ, но по-прежнему считывать данные до сих пор в ваших обратных вызовах, что я не думаю, что охвачено в существующих запросах функций.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...