Я хочу провести сравнительный анализ индексов полнотекстового поиска в PostgreSQL, SQLServer и Lucene.
Есть идеи о том, где найти хороший большой пример базы данных для выполнения запросов?
Большое спасибо заранее.
Я думаю, что хорошим источником будет дамп базы данных Википедии, так как он содержит действительно большое количество текста.Они доступны здесь: http://dumps.wikimedia.org/
Вы также можете попробовать использовать архив usenet, но выбрать целевой язык сложнее, а качество используемого языка также ниже.