Извлечение данных из API Википедии - PullRequest
0 голосов
/ 29 февраля 2012

Я играю с API Википедии.

Я хотел бы получить все названия стран из http://en.wikipedia.org/wiki/List_of_sovereign_states.

Я пробовал с http://en.wikipedia.org/w/api.php?format=jsonfm&action=query&prop=revisions&titles=List_of_sovereign_states&rvprop=content,, но все полезные данные находятся внутри одной строки.

Есть ли шанс отфильтровать это и получить только названия стран?

1 Ответ

2 голосов
/ 29 февраля 2012

Вы можете попытаться проанализировать строку, но нет гарантии, что она не изменится в будущем.

Вам было бы лучше, если бы вы посмотрели на Категория: Страны по континентам и получили имена членов своих подкатегорий. Но вам все равно придется отфильтровать шум, такой как «Список суверенных государств и зависимых территорий в Европе».

В качестве другого варианта вы можете получить этот список из другого источника, например API Всемирного банка: http://api.worldbank.org/countries?format=json

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...