Важный текст / термины: установите для фонового фильтра значение «пустой набор» - PullRequest
0 голосов
/ 17 июня 2020

Я хотел бы сделать существенное агрегирование текста / терминов. Однако вместо того, чтобы измерять значимость по сравнению с другим набором документов, используя background_filter или значение по умолчанию (которое, как я понимаю, представляет собой весь индекс), я хотел бы измерить значимость по пустому набору документов.

Мой вариант использования - создание списка частых / общих терминов. Я думал, что если количество документов в базовом случае равно 0, то значимость будет определяться частотой в отфильтрованном наборе.

Это правильный способ сделать это? Другой подход, который я рассмотрел, - это включение fieldata в мое текстовое поле и выполнение простой агрегации терминов, но документация, похоже, настоятельно предупреждает против включения fielddata.

Большое спасибо.

...