как разобрать строку в паука из другого скрипта - PullRequest
0 голосов
/ 05 июля 2010

Я новичок в питоне и скрапе. Я запускаю scrapy-ctl.py из другого скрипта Python, используя subprocess module. Но я хочу проанализировать «стартовый URL» для паука из этот скрипт сам. Есть ли возможность разобрать start_urls (которые определяется в скрипте, из которого запускается scrapy-ctl) к пауку? Я буду благодарен за любые предложения или идеи относительно этого .... :)

Заранее благодарен ....

1 Ответ

2 голосов
/ 06 июля 2010

Вы можете переопределить метод start_requests() в своем пауке, чтобы получить начальные запросы (которые по умолчанию генерируются с использованием URL-адресов в атрибуте start_urls).

...