получить текущий статус статей в Википедии? - PullRequest
1 голос
/ 06 июля 2011

Я использую Python и MySQL для запроса базы данных MediaWiki для получения текущего статуса статей (то есть, является ли статья FA, GA, GAN и т. Д.), Но мне не удалось это сделать.

Я знаю, что текущий статус хранится в поле old_text текстовой таблицы. Я пытался что-то вроде:

loc = select (locate('currentstatus', old_text))
query = ('select substring(old_text, '%s', 20) from wikidb where page_id = 1234' % (loc))

но, к сожалению, loc дает первое вхождение currentstatus, а не последнее, которое не очень «актуально», так как самый новый / последний статус находится внизу.

Я не уверен, как это исправить или я использую правильный подход.

1 Ответ

0 голосов
/ 08 июля 2011

Для Википедии было бы более уместно изучить категории, в которых находится статья. Или, если обрабатывается необработанный вики-текст, найдите соответствующий шаблон:

  • Избранные статьи (FA) находятся в[[category: Избранные статьи]] и используйте {{Избранные статьи}}, на которые ссылаются [[template: Избранные статьи]]
  • Хорошие статьи (GA) находятся в [[Категория: Хорошие статьи]] и используйте{{хорошая статья}}, которая ссылается на [[template: good article]]

Обе эти категории скрыты, поэтому вам придется включить предпочтение для отображения скрытых категорий или просмотреть содержимое категориичтобы увидеть, есть ли статья.

Другие классы статьи (A, B, C, FL, Start, Stub, List, undefined) оцениваются на соответствующей странице обсуждения с использованием одного или нескольких шаблонов WikiProject.Там нет стандарта.

...