Используя функцию more_like_this ElasticSearch, я понимаю, как использовать tf-idf или другие метрики для поиска похожих документов на основе текстовых полей. Однако, что, если мой вариант использования больше похож на это:
# Name Description Price Date
--------------------------------------------
1 A B C Ba Bi Bou 100.0 12-01-18
--------------------------------------------
2 A B Z Ba Bi Xon 250.0 01-11-11
3 X Y Z Xa Xu Xon 100.0 12-02-18
Исходя только из текстовых полей, документ № 2 должен иметь более высокую оценку, чем документ № 3, с точки зрения сходства с документом № 1, поскольку документ № 3 будет иметь балл 0. Однако, принимая во внимание «цену» и «дату», документ № 3 должен подняться.
Могу ли я сделать что-то подобное с ElasticSearch? Единственная документация, которую я нахожу, касается текстовых полей. Добавление нетекстовых полей в запрос more_like_this не вызывает каких-либо исключений, однако на оценки это никак не влияет.