Как извлечь и импортировать страницы Википедии? - PullRequest
0 голосов
/ 23 января 2011

Я создаю поисковую систему, и для ее проверки нужно больше статей. Лучший источник для них - Википедия.

Я искал некоторые дампы, но некоторые из них являются XML (которые у меня возникают проблемы с импортом), некоторые не с содержанием там.

Итак, как получить дамп, желательно в форме MySQL. Это должен быть не английский язык.

Есть идеи?

1 Ответ

3 голосов
/ 23 января 2011

Здесь - страница, объясняющая, как импортировать Википедию в Solr.

Здесь - пошаговое объяснение загрузки дампа Википедии в Mysql для запуска локального клона.

...