Scrapy
не использует браузер, это синтаксический анализатор для статического HTML, как BeautifulSoup
.если вы хотите анализировать динамическую страницу (сгенерированный javascript), используйте selenium
и при желании вы можете отправить исходный код страницы в Scrapy.
Чтобы настроить Scrapy на использование пользовательского пользовательского агента (Chrome), в settings.py
добавить
USER_AGENT = Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36
или my_spider.py
class MySpider(scrapy.Spider):
def start_requests(self):
yield scrapy.Request(self.start_urls, callback=self.parse, headers={"User-Agent": "Your Custom User Agent"})