Я пытаюсь получить код для чтения на веб-странице, используя заставку для более сложного сайта, но я даже не могу заставить код работать для этого простого местоположения сайта. Я запустил докер, и в моем файле settings.py порт 8050 сопоставлен с 0.0.0.0. Любая помощь будет принята с благодарностью. Пожалуйста, предоставьте версию, которую вы использовали для любого пакета, так как я боюсь, что это может быть проблемой.
Я пробовал многочисленные исправления ошибок по пути. Изменение версий Splash, Scrapy и Twisted. Scrapy работает только на Python 3.x с более новой версией Twisted, но Splash говорит, что несравнимо с Twisted> 16.2. Поэтому я попытался переключить некоторые версии без каких-либо исправлений.
import scrapy
import scrapy_splash
class ExampleSpider(scrapy.Spider):
name = "test"
#allowed_domains = ["Monster.com"]
start_urls = [
'http://quotes.toscrape.com/page/1/'
]
def start_requests(self):
for url in self.start_urls:
yield scrapy_splash.SplashRequest(url, self.parse,
args={
'wait': 0.5,
},
endpoint='render.html',
)
def parse(self, response):
for quote in response.css('div.quote'):
print (quote.css('span.text::text').extract())
Я должен просто получить тексты цитаты, т.е. это тот же URL из документации по питону