Я хочу использовать Wikipedia api для извлечения результата этой страницы:
http://en.wikipedia.org/wiki/Special:PrefixIndex
При поиске «что-то» на нем, например, это:
http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4
Затем я хотел бы получить доступ к каждой из полученных страниц и извлечь их информацию.
Какой вызов API можно использовать?
Вы можете использовать list=allpages и указать apprefix.Например:
list=allpages
apprefix
http://en.wikipedia.org/w/api.php?format=xml&action=query&list=allpages&apprefix=tal&aplimit=max
Этот запрос даст вам идентификатор и название каждой статьи, которая начинается с tal.Если вы хотите получить больше информации о каждой странице, вы можете использовать этот список как генератор :
tal
http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info
Вы можете присвоить * 1016 различные значения* параметр для получения различной информации о странице.