Сохранять частоту документа Elasticsearch постоянной при изменении индекса - PullRequest
0 голосов
/ 26 февраля 2020

Я использую Elasticsearch для получения XML документов по терминам. У меня есть несколько индексов, по одному на каждый день. У меня есть большая коллекция документов, которая в некотором смысле является представительной. Частота документа, состоящая из нескольких терминов, меняется изо дня в день.

Мое сопоставление зависит от частоты использования обратных терминов в документе. Я хотел бы не использовать IDF для индексов, которые я ищу, а вместо этого использовать IDF на основе большого репрезентативного набора. Есть ли простой способ сделать это без написания пользовательских функций оценки для больших и сложных запросов?

1 Ответ

0 голосов
/ 26 февраля 2020

Другого пути нет.

FWIW, Чтобы получить доступ к IDF и использовать его, вам нужно написать пользовательский скрипт Engine вasticsearch и, вероятно, использовать этот скрипт на основе движка для сортировки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...