Question

Я использую Elasticsearch для получения XML документов по терминам. У меня есть несколько индексов, по одному на каждый день. У меня есть большая коллекция документов, которая в некотором смысле является представительной. Частота документа, состоящая из нескольких терминов, меняется изо дня в день.

Мое сопоставление зависит от частоты использования обратных терминов в документе. Я хотел бы не использовать IDF для индексов, которые я ищу, а вместо этого использовать IDF на основе большого репрезентативного набора. Есть ли простой способ сделать это без написания пользовательских функций оценки для больших и сложных запросов?

Nirmal · Answer 1 · 26 февраля 2020

Другого пути нет.

FWIW, Чтобы получить доступ к IDF и использовать его, вам нужно написать пользовательский скрипт Engine вasticsearch и, вероятно, использовать этот скрипт на основе движка для сортировки.

Сохранять частоту документа Elasticsearch постоянной при изменении индекса

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сохранять частоту документа Elasticsearch постоянной при изменении индекса

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов