Как получить данные таблицы из Википедии с помощью API - PullRequest
0 голосов
/ 05 апреля 2020

Как мне структурировать мой запрос, чтобы получить данные из (первой) таблицы в разделе Запись смешанных единоборств из https://en.wikipedia.org/wiki/Michael_Bisping? В идеале я хотел бы получить данные таблицы как json, но HTML тоже будет работать.

Я пробовал этот запрос, чтобы получить разделы страницы: https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping

Результат говорит мне, что таблица находится в разделе с индексом 12. Я не знаю, какой запрос мне следует выполнить дальше.

Ответы [ 2 ]

1 голос
/ 05 апреля 2020

Используйте там API Sandbox для генерации URL!

Установите action на parse.

Page на Michael Bisping

Section до 12 (запись смешанных боевых искусств)

Окончательный URL:

https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text&section=12&callback=


Я использовал prop=extracts с action=query для анализа результат:
https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts

Однако этот запрос невозможен (?) для section=12, может быть есть другой способ анализа результата

0 голосов
/ 05 апреля 2020

Мне удалось получить весь раздел с помощью этого запроса: https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping&section=12

Я нацеливаюсь на указанный раздел c, запрашивая его индекс (в нашем случае 12).

...