Как проиндексировать все термины в документе в Lucene? - PullRequest
0 голосов
/ 31 января 2012

Документы, которые я индексирую, очень большие.Lucene по умолчанию индексирует только первые 10000 терминов документа, чтобы избежать ошибок OutOfMemory.Так что я получаю неправильные попадания при поиске по индексу.Как я могу проиндексировать все термины в документе?

1 Ответ

0 голосов
/ 31 января 2012

IndexWriter.MaxFieldLength.Указывает максимальную длину поля (в количестве токенов / терминов) в конструкторах IndexWriter

Вы можете установить максимальное значение как часть конструктора IndexWriter MAX_VALUE - Последние версии Lucene или UNLIMITED - Lucene OlderВерсии .

Вы также можете использовать IndexWriter.setMaxFieldLength(int) для переопределения значения, установленного конструктором.

...