Использование Scrapy для очистки веб-страницы - PullRequest
0 голосов
/ 10 октября 2019

Я пытаюсь очистить самую большую таблицу с этой страницы. Я работаю в приглашении conda

http://www.tennisabstract.com/cgi-bin/player-classic.cgi?p=RafaelNadal&f=ACareerqq

Вот моя попытка:

scrapy shell
fetch('http://www.tennisabstract.com/cgi-bin/player-classic.cgi?p=RafaelNadal&f=ACareerqq')
table = response.xpath('//table[@id="matches"]')
rows = table.xpath('//tr')

Это похоже на правильную таблицу, но я получаю строкине верны;они приходят с верхней части веб-страницы.

Моя другая попытка была такой:

table = response.xpath('//table[@id="matches"]//tr')

Но это просто возвращает пустой список.

Любая помощь приветствуется

Спасибо

1 Ответ

0 голосов
/ 10 октября 2019

table.extract() возвращает пустую таблицу ['<table id="matches"></table>'] здесь. Кажется, данные загружаются в таблицу динамически. Вам потребуется использовать Selenium или ScrapyJS для получения данных в таких случаях. Для получения дополнительной информации см. Ссылку

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...