Я использую Lucene для поиска в документах HTML.У меня проблема с увеличенным размером индексных файлов, у меня размер HTML-файлов около 300-400 МБ, но индекс работает до 0,98 ГБ.Причину я вижу из-за уточнения у нас.Как мы индексируем одно и то же содержимое для четырех различных полей, что, как я полагаю, является проблемой (мы используем одно и то же содержимое, одно с учетом регистра и другое в противном случае, одно с учетом регистра со специальными символами, а другое - в противном случае).уменьшить размер индекса?Сохраняя те же требования?Есть ли другой способ индексации и поиска по-разному для поддержки всех?