когда стоит использовать JDBC с индексами Lucene? - PullRequest
1 голос
/ 11 января 2012

Я внедряю поисковую систему на основе lucene (Compass) для нашего приложения, и мы будем развертывать ее в среде VMware.Клиент говорит мне, что производительность ввода-вывода на хосте vmware настолько низкая, что хранилище JDBC для lucene предпочтительнее, чем общее хранилище файлов индекса.Я удивлен этим.

Так что мне интересно, если у вас есть выбор, каковы некоторые плюсы и минусы использования базы данных или общего хранилища для индексов lucene в кластерной среде?Зависит ли это от ожидаемого числа записей индекса?

1 Ответ

0 голосов
/ 11 января 2012

Я бы попросил некоторые данные для подтверждения этого утверждения. Разве базы данных также не используют ввод-вывод? Или ваше решение JDBC подключится к не виртуализированному экземпляру базы данных?

Как часто вы переиндексируете Lucene? Я не понимаю, как это может быть проблемой, если вы делаете это только один раз в день, используя отдельное пакетное задание.

Я бы предпочел Lucene JDBC, потому что решение требовало возможности поиска. Попробуйте когда-нибудь выполнить поиск в свободной форме с предложениями SQL и LIKE. Это казалось бы гораздо более неэффективным.

Если это большая проблема, попробуйте небольшой тест.

...