Как получить ссылки на википедию статьи в python? - PullRequest
0 голосов
/ 06 февраля 2020

Я хочу получить ссылки на статьи из Википедии. Под внешними ссылками я подразумеваю ссылки в разделе What links here в статьях википедии.

Например, рассмотрим статью data mining википедии. What links here раздел этой статьи находится в: https://en.wikipedia.org/wiki/Special: WhatLinksHere / Data_mining

Я пытался использовать pywikibot следующим образом.

import pywikibot as pw

site = pw.Site('en', 'wikipedia')
print([
    cat.title()
    for cat in pw.Page(site, 'data mining').categories()
    if 'hidden' not in cat.categoryinfo
])

Однако, похоже, что categories в pywikibot отличается от ссылок на ссылки из статей википедии. Поэтому мне интересно, как это сделать в python.

Примечание: я не ограничен Pywikibot и с удовольствием изучаю другие библиотеки, такие как mediawiki.

Я рад предоставьте больше деталей, если это необходимо.

1 Ответ

2 голосов
/ 06 февраля 2020

Попробуйте Page.embeddedin() и Page.backlinks(). Вы также можете напрямую использовать эквивалентные модули API MediaWiki:

...