Мне нужно извлечь ссылки в таблице с веб-сайта (имя класса внутреннее), но я всегда получаю Crawled 0 страниц, а загрузчик получает кучу байтов.
class geneDetails(scrapy.Spider):
name = "details"
def start_requests(self):
urls = ['https://ecocyc.org/gene?orgid=ECOLI&id=G7688']
for url in urls:
yield scrapy.Request(url=url, callback=self.parse)
def parse(self, response):
details = response.xpath('//*[contains(@class,"internal")]/tbody/tr').extract()
for det in details:
gene_det = det.xpath('./text()').extract()
Уже много чего перепробовал, но так и не сработал, код выше был моей последней попыткой, извините за все, а не специалистом по scrapy / xpath.