Где я могу найти тесты производительности для Apache Lucene / Solr - PullRequest
12 голосов
/ 22 февраля 2012

Есть ли какие-либо ссылки / ресурсы для оценки производительности для Lucene / Solr для больших наборов данных. Наборы данных выше диапазона 500 ГБ ~ 5 ТБ

Спасибо

1 Ответ

17 голосов
/ 22 февраля 2012

коммиттер Lucene Майк Маккэндлесс регулярно запускает тесты для отслеживания улучшений производительности и регрессий.Они сделаны с помощью экспорта из Википедии, который может быть немного меньше того, что вы ищете.

Но производительность зависит не столько от размера ввода, сколько от количества документов и уникальныхтермины.Если у вас уже есть данные, аналогичные тем, которые вам нужно индексировать, я бы порекомендовал вам проверить инструмент тестирования Майка , адаптировать его к вашим потребностям и запустить его с вашим собственным набором данных и оборудованием, чтобы попытаться найтикакие показатели производительности вы можете ожидать.

...