Чтобы ответить на ваши вопросы
1.) У меня есть база данных с около 5 миллионов документов.MySQL Fulltextsearch требуется 2-3 минуты.Solr / Lucene нуждается в том же поисковом раунде около 200-400 миллисекунд.
2.) Необходимое пространство зависит от вашей конфигурации, количества полей копирования, а также от того, храните ли вы данные или индексируете их.В моей конфигурации полная БД индексируется, но оцениваются только метаданные.Таким образом, для базы данных 30 ГБ требуется 40 ГБ для Solr / Lucene.Имейте в виду, что если вы хотите (повторно) оптимизировать свой индекс, вам снова понадобятся временные 100% размера индекса.
3.) Если вы переходите с полнотекстового индекса MySQL на Lucene / Solr,Вы экономите мощность процессора.Для использования MySQL Fulltext требуется гораздо больше ресурсов процессора, чем для полнотекстового поиска Solr -> посмотрите на ответ 1.)
4.) Зависит от количества документов, размера документов и скорости диска.Конечно, производительность процессора очень важна.Во время индексации хорошее масштабирование по нескольким процессорам отсутствует.2 больших ядра намного быстрее, чем 8 маленьких.Для индексации 5 миллионов документов (44 ГБ) в моей среде требуется 2-3 часа на двухъядерном сервере VMware.
5.) Миграция с полнотекстового индекса MySQL на Lucene / Solr Fulltextindex была лучшей идеей.;-) Но, вероятно, вам придется перепроектировать ваше приложение.
// Изменить, чтобы ответить на вопрос «Будет ли индекс Lucene обновляться сразу после некоторых операторов вставки»
Это зависит от конфигурации SOlR, но это возможно