Я пытаюсь соскрести некоторую информацию из компании Великобритании.Я установил соединение с сайтом через оболочку и с помощью команды
scrapy shell https://beta.companieshouse.gov.uk/search?q=a
и с помощью
response.xpath('//*[@id="results"]').extract()
мне удалось получить результаты обратно.
Я пыталсяположить это в программу, чтобы я мог экспортировать его в CSV или JSON.Но у меня проблемы с тем, чтобы заставить его работать .. Вот что я получил;
import scrapy
class QuotesSpider(scrapy.Spider):
name = "gov2"
def start_requests(self):
start_urls = ['https://beta.companieshouse.gov.uk/search?q=a']
def parse(self, response):
products = response.xpath('//*[@id="results"]').extract()
print(products)
Очень просто, но много пробовал.Любое понимание будет оценено !!