«повысить» документ на основе тегов из модели классификации текста (Elasticsearch) - PullRequest
0 голосов
/ 25 мая 2019

Я индексирую совокупность документов (новостные статьи, сообщения на форумах и т. Д.) В Elasticsearch.Чтобы улучшить поиск, я также обучил документ классификации моделей SVM + Tf-Idf для создания тегов в таксономии, например News- Politics, News-Sports, Post-US Politics и т. Д. Мой вопрос: как мне взвесить баллы, сгенерированныеклассификатор для записи документа в ES?

Я использовал хакерский подход, например, если я получаю score 0,7 для News-Sports, я пишу ["News-Sports"] * int(оценка * 10) т.е. напишите News-Sports как 7 терминов в поле tags документа.

Существуют ли более эффективные способы взвешивания по индексу?

1 Ответ

0 голосов
/ 25 мая 2019

Я не уверен, полностью ли я понимаю ваш вопрос. Я понимаю это как добавление веса для каждого сгенерированного тега, который может повлиять на релевантность.

Если это так, вы можете использовать field_value_factor. Вы можете записать в документ и тег, и его вес, а затем использовать запрос функции, чтобы увеличить эти значения.

https://www.elastic.co/guide/en/elasticsearch/guide/master/boosting-by-popularity.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...