Можете ли вы установить условия при очистке с помощью Scrapy? - PullRequest
1 голос
/ 12 октября 2019

Мне было интересно, смогу ли я установить некоторые условия, которые должны соблюдаться для хранения информации (выполнение очистки веб-страниц с помощью Scrapy версии 1.7.3).

Например, хранение фильмов только срейтинг больше 7 при просмотре веб-сайта IMDB.

Или мне придется делать это вручную при просмотре выходного файла? (В настоящее время я вывожу данные в виде файла CSV)

1 Ответ

1 голос
/ 13 октября 2019

Это интересный вопрос, и да, scrapy может вам в этом полностью помочь. Есть несколько подходов, которые вы можете использовать, если это только для манипулирования элементами перед тем, как они действительно «возвращают» их (что означает, что это уже вывод), возможно, я бы порекомендовал использовать Загрузчики элементов , которые в основном помогают вам настроитьправила для каждого поля в каждом элементе.

Для фактического отбрасывания элементов с соответствующими правилами я рекомендую вам использовать и Конвейер элементов , который служит в качестве окончательного фильтра перед повторным возвратом элементов вв этом случае вам было бы интересно объединить его с чем-то вроде Цербер , который поможет вам определить схемы всего элемента и в соответствии с этим отбросить или вернуть элемент.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...