Я индексирую совокупность документов (новостные статьи, сообщения на форумах и т. Д.) В Elasticsearch.Чтобы улучшить поиск, я также обучил документ классификации моделей SVM + Tf-Idf для создания тегов в таксономии, например News- Politics
, News-Sports
, Post-US Politics
и т. Д. Мой вопрос: как мне взвесить баллы, сгенерированныеклассификатор для записи документа в ES?
Я использовал хакерский подход, например, если я получаю score
0,7 для News-Sports
, я пишу ["News-Sports"] * int(оценка * 10) т.е. напишите News-Sports
как 7 терминов в поле tags
документа.
Существуют ли более эффективные способы взвешивания по индексу?