Я использую Lucene с приложением Tomcat.У меня много больших и маленьких документов, которые нужно проиндексировать.Большие документы редко добавляются, а небольшие документы часто добавляются.Мой текущий план очистки индексов состоит в том, чтобы сделать это в одноэлементном потоке, который выполняется в приложении tomcat.Я хочу сделать это, потому что частые небольшие добавления документа не должны вызывать сброс каждый раз, когда они добавляют документ.Таким образом, индекс всегда будет отставать от фактических индексируемых документов.
Вопросы, если функция сумматора не выполняет сброс, и по какой-то причине lucene создает исключение IOException при вызове сброса в потокекак приложение узнает, какие документы эффективно неиндексированы, и что с этим можно сделать.Попытка повторного чтения проиндексированных данных, похоже, не является правильным решением, потому что исключение, скорее всего, произойдет снова.
Кроме того, плохо ли запускать lucene в кластере tomcat?Должен ли я запускать lucene в отдельном java-процессе, и если да, то как это будет работать?
И безопаснее ли использовать lucene против файловой системы или mysql?Очевидно, это вопросы новичка.
Andy