Python xpath для получения текста из таблицы - PullRequest
0 голосов
/ 12 ноября 2018

Итак, с помощью запроса и lxml я пытался создать небольшой API, который с определенными параметрами мог бы загружать расписание с определенного веб-сайта, этот , дело в том, что я полный новичок в таких вещах, как эти и кроме часов, я не могу получить что-нибудь еще.

Я возился с кодом xpath, но в основном получаю простой []. Я пытался получить первую строку классов, которая соответствует первой строке часов (8.00-8.30), которая, вероятно, должна выглядеть примерно так [,,, Introdução à Gestão,].

page = requests.get('https://fenix.iscte-iul.pt/publico/siteViewer.do?method=roomViewer&roomName=2E04&objectCode=4787574275047425&executionPeriodOID=4787574275047425&selectedDay=1542067200000&contentContextPath_PATH=/estudante/consultar/horario&_request_checksum_=ae083a3cc967c40242304d1f720ad730dcb426cd')
tree = html.fromstring(page.content)
class_block_one = tree.xpath('//table[@class="timetable"]/tbody/tr[1]/td[@class=*]/a/abbr//text()')
print(class_block_one)

1 Ответ

0 голосов
/ 12 ноября 2018

Чтобы получить необходимый текст из первой (фактически второй) строки, вы можете попробовать ниже XPath

'//table[@class="timetable"]//tr[2]/td/a/abbr//text()'

Вы можете получить значения из всех строк:

for row in tree.xpath('//table[@class="timetable"]//tr'):
    print(row.xpath('./td/a/abbr//text()'))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...