черточка дефиса игнорируется в атрибуте xpath - PullRequest
0 голосов
/ 14 декабря 2018

На basketball-reference.com есть таблица, которую я хочу проанализировать с помощью Xpath и Scrapy.Когда я пытаюсь очистить все строки, имеющие атрибут data-row, я ничего не получаю.Тем не менее, я могу получить доступ к дочерним элементам строк данных до тех пор, пока конкретно не скажу «строка данных».Я считаю, что это связано с дефисом в имени атрибута.

def parse_item(self, response):

        rows = response.xpath("//tr[@data-row]")
        print(rows)

Вывод = []

Я сделал обходной путь к этому, однако, если бы я мог знать, что не так, это было бы здорово.

1 Ответ

0 голосов
/ 17 декабря 2018

eLRuLL был достаточно любезен, чтобы дать ответ в комментариях к моему вопросу.Я считаю, что часть «-row» была динамически добавлена ​​через JavaScript.Я снова столкнулся с проблемой на другом сайте.Используя Google Chrome и перейдя в Инструменты разработчика-> Сеть-> JS, я просмотрел скрипт, который добавляет атрибут класса.Я предполагаю, что это то, что происходило раньше, основываясь на комментарии eLRuLL, и что другой веб-сайт действительно делал это так.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...