Я использую Elasticsearch для получения XML документов по терминам. У меня есть несколько индексов, по одному на каждый день. У меня есть большая коллекция документов, которая в некотором смысле является представительной. Частота документа, состоящая из нескольких терминов, меняется изо дня в день.
Мое сопоставление зависит от частоты использования обратных терминов в документе. Я хотел бы не использовать IDF для индексов, которые я ищу, а вместо этого использовать IDF на основе большого репрезентативного набора. Есть ли простой способ сделать это без написания пользовательских функций оценки для больших и сложных запросов?