Рефакторинг правила в скрапе - PullRequest
0 голосов
/ 16 апреля 2019

У меня есть правило, где я чищу главную страницу:

rules = (Rule(LinkExtractor(allow=('quotes.toscrape.com'), deny=('author', 'tag', 'page', 'login')), callback='parse_main_page'))

Раздел «Запретить» изменяется вручную каждый раз, когда добавляется страница второго уровня. Существует ли в правиле более простой способ блокировать анализ страниц второго уровня для анализа только главной страницы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...