Как мне структурировать мой запрос, чтобы получить данные из (первой) таблицы в разделе Запись смешанных единоборств из https://en.wikipedia.org/wiki/Michael_Bisping? В идеале я хотел бы получить данные таблицы как json, но HTML тоже будет работать.
Я пробовал этот запрос, чтобы получить разделы страницы: https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping
Результат говорит мне, что таблица находится в разделе с индексом 12. Я не знаю, какой запрос мне следует выполнить дальше.
Используйте там API Sandbox для генерации URL!
Установите action на parse.
action
parse
Page на Michael Bisping
Page
Michael Bisping
Section до 12 (запись смешанных боевых искусств)
Section
12
Окончательный URL:
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text§ion=12&callback=
prop=extracts
action=query
https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts
Однако этот запрос невозможен (?) для section=12, может быть есть другой способ анализа результата
section=12
Мне удалось получить весь раздел с помощью этого запроса: https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping§ion=12
Я нацеливаюсь на указанный раздел c, запрашивая его индекс (в нашем случае 12).