Можно ли отфильтровать ссылки статьи в Википедии в одном запросе? - PullRequest
0 голосов
/ 07 декабря 2010

Я пытаюсь использовать API Википедии для извлечения ссылок, в которые встроено Template: Persondata из статьи в одном вызове.

например, статьи всех людей, что статья "Джордж Клуни "ссылается на.

в качестве обходного пути:

  1. Я получаю список статей, используя prop = links param

    http://en.wikipedia.org/w/api.php?action=query&prop=links&titles=George_Clooney&pllimit=500&plnamespace=0&format=json

  2. затем проверяем шаблоны каждой статьи, чтобы увидеть, содержит ли она Шаблон: Persondata .

    http://en.wikipedia.org/w/api.php?action=query&prop=templates&titles=*article_title*&tllimit=500&format=json

Я знаю, что с помощью запроса list = embeddedin мы можем получить все статьи определенного шаблона, но он используется для фильтрации всех статей в Википедии.

возможно ли использовать что-то похожее для фильтрации списка статей, которые я получаю на шаге 1?или есть лучший способ?

Заранее спасибо

1 Ответ

1 голос
/ 07 декабря 2010

Вот запрос, который даст вам список ссылок на странице Джорджа Клуни и все встроенные в них шаблоны. Вы можете использовать это, чтобы вытащить только статьи со встроенным Template: Persondata.

http://en.wikipedia.org/w/api.php?action=query&generator=links&titles=George_Clooney&prop=templates&tllimit=500&format=json

...