На стороне сервера вы можете просто экспортировать из базы данных. Удаленно Pywikipediabot имеет скрипт под названием get.py
, который получает вики-код данной статьи. Это также довольно просто сделать вручную, как-то так (при записи из памяти могут возникнуть ошибки):
import wikipedia as pywikibot
site = pywikibot.getSite() # assumes you have a user-config.py with default site/user
article_list = ["Apple", "Banana", "Cupcake"]
for title in article_list:
page = pywikibot.Page(title, site)
text = page.get() # handling of not found etc. exceptions omitted
file = open(title + ".txt", "wt")
file.write(text)
Поскольку язык MediaWiki не является четко определенным, единственный надежный способ его анализа / обработки - это сам MediaWiki; в Pywikipediabot такой поддержки нет, и несколько инструментов, пытающихся это сделать, не работают со сложными шаблонами.