Я только что установил scrapy и следовал их простому учебнику dmoz , который работает.Я просто просмотрел базовую обработку файлов для python и попытался заставить сканер прочитать список URL-адресов из файла, но получил некоторые ошибки.Это, вероятно, неправильно, но я дал ему шанс.Кто-нибудь, пожалуйста, покажите мне пример чтения списка URL в scrapy?Заранее спасибо.
from scrapy.spider import BaseSpider
class DmozSpider(BaseSpider):
name = "dmoz"
allowed_domains = ["dmoz.org"]
f = open("urls.txt")
start_urls = f
def parse(self, response):
filename = response.url.split("/")[-2]
open(filename, 'wb').write(response.body)