Попытка сделать веб-скребок для этого сайта: https://stats.nba.com/search/team-game/#? Sort = GAME_DATE & dir = 1 & Season = 2019-20
здесь я хочу, чтобы скребок набрал go и потяните данные для каждой опубликованной игры NBA. Прямо сейчас я просто пытаюсь заставить это вытянуть название команды, играющей (первая колонка). Однако при попытке запустить паука я получаю пустой json файл.
Вот мой код:
import scrapy class TeamsDataScraper(scrapy.Spider): name = "teamdata" #def start_requests(self): urls = ["http://stats.nba.com/search/team-game/#?sort=GAME_DATE&dir=1&Season=2019-20"] #for url in urls: #yield scrapy.Request(url=url, callback=self.parse) def parse(self, response): for team in response.xpath("//td[@class='player-name text']"): yield{ 'teamName': team.xpath(".//td[@class='player-name text']/a/text()").extract_first() }
Это потому, что ваш скребок вообще не имеет никакой точки входа
Вы должны иметь любой из ниже
start_urls
urls
start_requests
yield
scrapy.Request