как можно найти категории страницы википедии, используя только ссылки страниц? - PullRequest
3 голосов
/ 18 марта 2012

Существует ли какой-либо API, с помощью которого можно получить все категории страницы, используя заголовок или идентификатор страницы или URL-адрес этой страницы? Я пытался искать в сети, но все, что я мог найти, это получать дампы для определенных категорий. Любая помощь будет высоко оценена. Спасибо

Ответы [ 2 ]

8 голосов
/ 18 марта 2012

API, который вы ищете, находится здесь https://en.wikipedia.org/w/api.php Это медиа-вики-API и содержит много документации.

Как сказано выше, вы ищете проп = категории итак ... ? format = xml & action = query & prop = категории и заголовки = Google например

https://en.wikipedia.org/w/api.php?format=xml&action=query&prop=categories&titles=Google

Если вы хотите использовать это в программе, возможно, стоит заглянуть на следующую страницу Википедии, которая содержит серию классов и библиотек для различных языков для работы с API Википедии e.t.c

Википедия: Creating_a_bot # Programming_languages_and_libraries

7 голосов
/ 18 марта 2012

MediaWiki (программное обеспечение Википедии) имеет API, и вы действительно можете сделать запрос, чтобы получить категории страницы.Например, следующий код возвращает категории страницы Google в Википедии на английском языке:

https://en.wikipedia.org/w/api.php?format=xml&action=query&prop=categories&titles=Google

Обратите внимание, что не все категории возвращаются в одном ответе.Вы увидите элемент с именем query-continue, который предоставляет дополнительную информацию о том, как следует формулировать следующий запрос, что даст вам больше категорий.

Ссылки:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...