Я строю систему, в которой я хочу показывать только результаты, проиндексированные за последние несколько дней.
Более того, я не хочу вести гигантский индекс с миллионами документов, если я хочу только вернуть результаты за пару дней (тысячи документов).
С другой стороны, моя система полагается, что вхождения терминов в документах, хранящихся в индексе, имеют реалистичное распределение (следовательно: реалистичный IDF).
Тем не менее, я хотел бы использовать небольшой индекс для возврата результатов, но я хочу вычислить оценку документов, используя IDF из гораздо большего индекса (или даже из внешнего источника).
Подобное API, похоже, не позволяет мне это делать. Метод idf не получает в качестве параметра используемый термин.
Другая возможность - использовать TrieRangeQuery, чтобы убедиться, что показанные документы находятся в течение последних нескольких дней. Опять же, я скорее не поддерживаю больший индекс. Также этот вид запроса не из дешевых.