Question

вот код Python того, что я пробовал:

from lxml import html
import requests


page = requests.get('http://www.rsssf.com/tablese/eng2017det.html')
tree = html.fromstring(page.content)
print(tree.xpath('/html/body/table/tbody/tr[2]//text()'))

Я всегда получаю свой вывод, так как [] Я также проверил HTML-страницу, URL не поврежден

Andersson · Answer 1 · 02 октября 2018

Не используйте тег tbody в вашем XPath.Обратите внимание, что разработчик может пропустить этот тег, поэтому он будет автоматически добавлен браузером при отображении страницы.

Просто попробуйте

print(tree.xpath('/html/body/table//tr[2]//text()'))

или

print([i for i in tree.xpath('/html/body/table//tr[2]//text()') if i.strip()])

, чтобы избежать печатисимволы новой строки

xpath-запрос к HTML-таблице всегда возвращает пустую строку в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

xpath-запрос к HTML-таблице всегда возвращает пустую строку в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы