Доступ к названиям биографий в Википедии - PullRequest
0 голосов
/ 03 апреля 2012

Я скачал последний дамп Википедии и проанализировал базу данных MySQL.Теперь у меня есть таблица базы данных, которая содержит только заголовок и содержимое. Мое требование состоит в том, чтобы извлечь все содержимое биографии из этой таблицы. Так что я хочу файл дампа, который имеет все заголовки биографии.Заранее спасибо

1 Ответ

0 голосов
/ 03 апреля 2012

Если вы хотите получить все статьи в некоторой категории и во всех ее подкатегориях, вам нужно использовать таблицу categorylinks и рекурсивно просматривать ее, чтобы получить статьи в подкатегориях.

Из твоего вопроса не понятно, что именно ты хочешь.Если вы хотите статьи о биографиях, посмотрите на Категория: Биография .Если вы хотите статьи, которые являются биографиями, посмотрите на подкатегории Категория: Люди .

...