Out форумы (http://episteme.arstechnica.com) используют Lucene в качестве бэкэнда поиска, так что это выполнимо. Посты не индексируются не так быстро, как хотелось бы, но мы могли бы решить эту проблему, увеличив оборудование для индексирования и используя более разумная стратегия кэширования.
Общий ответ на этот вопрос: это зависит от того, какой у вас шаблон записи / обновления. Форумы относительно просты, так как большая часть контента является новой, а существующий контент обновляется реже.
Для форума я бы порекомендовал иметь индекс «архив» и «живой» индекс. Индекс в реальном времени может содержать сообщения за последний день, неделю, год, в то время как индекс архива будет включать большое количество сообщений, которые, вероятно, никогда больше не будут затронуты. Поэтому, когда кто-то создает новое сообщение, оно будет изначально проиндексировано в живом индексе. Позже некоторое пакетное задание очистит текущий индекс и переиндексирует все в архив.
Lucene отлично справляется с запросами по нескольким индексам. Вы должны злоупотреблять этой способностью. :)