Обычно полевой кэш - самый медленный компонент Lucene для прогрева, хотя другие вещи, такие как фильтры и указатели сегментов, вносят свой вклад. Конкретное количество, хранящееся в кеше, будет зависеть от вашего использования, особенно с такими вещами, как, например, объем хранимых данных (в отличие от только что проиндексированных).
Вы можете использовать любой инструмент исследования использования памяти, подходящий для вашей среды, чтобы увидеть, сколько Lucene потребляет для вашего приложения, но имейте в виду, что «стоимость прогрева» также относится к различным кэшам, которые ОС и файловая система оставайтесь открытыми, что, вероятно, не появится в top
или во всем, что вы используете.
Вы правы, что наличие тысяч индексов не является обычной практикой. Стандартный совет состоит в том, чтобы они разделяли индекс и использовали фильтры, чтобы гарантировать, что соответствующие результаты возвращены.
Поскольку вас интересует производительность, вы должны иметь в виду, что наличие тысяч индексов на сервере приведет к разбросу тысяч файлов по всему диску, что приведет к сотням времени поиска, которое не произойдет, если вы только что был один большой индекс. В зависимости от ваших требований, это может или не может быть проблемой.
В качестве примечания: похоже, вы используете сетевую файловую систему, что является большим ударом по производительности для Lucene.