Я пытаюсь извлечь информацию из таблиц Википедии.
Более конкретно, я пытаюсь составить список всех команд и всех игроков в высшей лиге.
До сих пор Я могу пройтись по всем командам в таблице команд Премьер-лиги на 2019-2020 годы, для каждой команды, которую я там попадаю, я попадаю на страницу Википедии и просматриваю, как ее игрок получает информацию.
Я думал, что есть фиксированный шаблон, в котором все команды высшей лиги в Википедии располагают свои таблицы игроков на позиции 3, но после обхода 6 команд они столкнулись с командой, которая находится на втором месте.
Поэтому я использовал следующий запрос XPath для вики-страница каждой команды
"//table[3]/tbody//tr[position() > 1]//td[4]//span/a/@href"
но, например, следующая таблица игроков команды находится на позиции 2, как я могу сделать этот запрос более обобщенным c и не зафиксировать его на определенной позиции? Я заметил, что перед всеми моими соответствующими таблицами есть элемент с текстом «Отряд первой команды»
Таблица HTML слишком длинная, поэтому я публикую здесь ссылку на вики определенного команда
https://en.wikipedia.org/wiki/Crystal_Palace_F.C.
Надеемся на помощь! спасибо.