Я хочу понять, как каждый из файлов индекса lucene (nvd, dvd, tim, doc ... в основном эти четыре) используется в запросе ES.Например, у моего индекса есть десять документов, и я делаю запрос агрегации.Я хотел бы понять, как ES / Lucene осуществляет доступ к этим четырем файлам для одного запроса.
Я пытаюсь выяснить, могу ли я провести некоторую оптимизацию в моей системе, которая в основном является дисковой системой, чтобы ускорить выполнение запросов.Я посмотрел на код ES и понял, что QueryPhase является самым дорогим, и, похоже, он делает много случайного доступа к диску для данных, ориентированных на журналы.
Я хочу сейчас углубиться на уровне Luceneа также и, возможно, отладить код и увидеть в действии.У кода Lucene есть нулевые сообщения журнала для связанных классов IndexReader.Также отладка кода lucene напрямую кажется бесполезной, поскольку unittest не создает индексы с файлами tim, doc, nvd, dvd
Есть ли какие-нибудь указатели?