Список страниц из Википедии - PullRequest
1 голос
/ 09 декабря 2010

Я создаю приложение, которое дает вам возможность выбирать предметы, которые вам нравятся, эти предметы должны быть в БД.

Есть миллионы лайков!(пицца, PHP, Манчестер Юнайтед, любой фильм ... я не знаю), поэтому я решил добавить эти «лайки» в мою БД с помощью Википедии.лайки »(с API у меня есть предел [500 за поиск, я думаю)?или другое решение?

Большое спасибо.

Ответы [ 3 ]

1 голос
/ 09 декабря 2010

Посмотрите техническую документацию WikiMedia. Есть раздел, в котором говорится о продолжении запроса .

Кроме того, вы можете скачать дамп Википедии, установить свою собственную копию WikiMedia и запросить содержимое вашего сердца. Дампы огромны, но в зависимости от того, сколько материала вы хотите извлечь, это может завершить задачу быстрее и с меньшим влиянием на службу Википедии.

1 голос
/ 09 декабря 2010

Немного неясно, какую информацию вы на самом деле пытаетесь получить из Википедии. Названия страниц?

Wikimedia предоставляет файлы XML, содержащие все заголовки страниц для всех своих проектов, по адресу download.wikimedia.org . (К сожалению, дампы в настоящее время недоступны из-за аппаратных проблем). Вы можете проанализировать файл XML и сохранить все заголовки в своей собственной базе данных.

0 голосов
/ 09 декабря 2010

Дампы доступны из Википедии в различных форматах с различными уровнями детализации.

Выберите тот, который лучше всего соответствует вашим потребностям, и проанализируйте его.

...