Есть ли другой способ получить список прокси и очистку сайта? - PullRequest
0 голосов
/ 23 июня 2019

При очистке я использую промежуточное прокси-сервер Random для Scrapy (https://github.com/aivarsk/scrapy-proxies).

Сначала я получаю list.txt (список прокси), соскребая сайт free-proxy (без вращения прокси) Затем я делаю соскоб другого сайта, (с прокси вращением) Когда я запускаю его в двух разных проектах Scrapy, он работает хорошо.

Вопрос в том, как совместить получение прокси и очистку в одном проекте scrapy или есть другой способ справиться с этим?

Я пытался запустить его вместе в одном проекте Scrapy, к сожалению, он не работает. Вероятно потому, что в этом случае scrapy-proxy пытается использовать list.txt для ротации прокси, который в данный момент пуст по запросу на free-proxy-site.

1 Ответ

0 голосов
/ 24 июня 2019

Существует возможность реализовать очищающие прокси и очищающий веб-сайт с прокси внутри класса одного паука. Этот пример кода реализует это как scrapy как приложение-скрипт .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...