Можно ли сравнить данные из нескольких индексов Lucene? Я хотел бы получить документы, которые имеют одинаковое значение в похожих полях (например, имя, фамилия) по двум индексам. Поддерживает ли Lucence запросы, которые могут это сделать?
Ну, отчасти. Вы можете создавать идентичные схемы документов по индексам и, по крайней мере, правильно получать набор совпадений. Однако, как показано в документации сходства Lucene , коэффициент idf (частота обратных документов) в оценке Lucene зависит как от размера индекса, так и от количества документов, имеющих поисковый термин в индексе. Оба эти фактора зависят от индекса. Поэтому одно и то же совпадение по разным показателям может получить разные оценки в зависимости от этих факторов.