Есть ли способ использовать нетекстовые поля для сходства документов в ElasticSearch, такие как даты или целые числа? - PullRequest
0 голосов
/ 12 ноября 2018

Используя функцию more_like_this ElasticSearch, я понимаю, как использовать tf-idf или другие метрики для поиска похожих документов на основе текстовых полей. Однако, что, если мой вариант использования больше похож на это:

#   Name    Description    Price    Date
--------------------------------------------
1   A B C   Ba Bi Bou      100.0    12-01-18
--------------------------------------------
2   A B Z   Ba Bi Xon      250.0    01-11-11
3   X Y Z   Xa Xu Xon      100.0    12-02-18

Исходя только из текстовых полей, документ № 2 должен иметь более высокую оценку, чем документ № 3, с точки зрения сходства с документом № 1, поскольку документ № 3 будет иметь балл 0. Однако, принимая во внимание «цену» и «дату», документ № 3 должен подняться.

Могу ли я сделать что-то подобное с ElasticSearch? Единственная документация, которую я нахожу, касается текстовых полей. Добавление нетекстовых полей в запрос more_like_this не вызывает каких-либо исключений, однако на оценки это никак не влияет.

...