lucene должен выполняться не так, как Tomcat - PullRequest
0 голосов
/ 01 ноября 2011

Я использую Lucene с приложением Tomcat.У меня много больших и маленьких документов, которые нужно проиндексировать.Большие документы редко добавляются, а небольшие документы часто добавляются.Мой текущий план очистки индексов состоит в том, чтобы сделать это в одноэлементном потоке, который выполняется в приложении tomcat.Я хочу сделать это, потому что частые небольшие добавления документа не должны вызывать сброс каждый раз, когда они добавляют документ.Таким образом, индекс всегда будет отставать от фактических индексируемых документов.

Вопросы, если функция сумматора не выполняет сброс, и по какой-то причине lucene создает исключение IOException при вызове сброса в потокекак приложение узнает, какие документы эффективно неиндексированы, и что с этим можно сделать.Попытка повторного чтения проиндексированных данных, похоже, не является правильным решением, потому что исключение, скорее всего, произойдет снова.

Кроме того, плохо ли запускать lucene в кластере tomcat?Должен ли я запускать lucene в отдельном java-процессе, и если да, то как это будет работать?

И безопаснее ли использовать lucene против файловой системы или mysql?Очевидно, это вопросы новичка.

Andy

1 Ответ

1 голос
/ 01 ноября 2011

Lucene действительно предназначен для разработки клиентских приложений. Если вы планируете использовать его в кластере серверов, тогда лучше использовать Solr . Вы также можете кластеризовать экземпляры Solr и использовать простой API RESTless для индексирования новых документов. Использование Lucene в tomcat может сработать, но в будущем оно не будет обслуживаться. С Solr у вас есть интерфейс администратора, и вы можете легко очистить все.

...