Я хотел бы сделать существенное агрегирование текста / терминов. Однако вместо того, чтобы измерять значимость по сравнению с другим набором документов, используя background_filter или значение по умолчанию (которое, как я понимаю, представляет собой весь индекс), я хотел бы измерить значимость по пустому набору документов.
Мой вариант использования - создание списка частых / общих терминов. Я думал, что если количество документов в базовом случае равно 0, то значимость будет определяться частотой в отфильтрованном наборе.
Это правильный способ сделать это? Другой подход, который я рассмотрел, - это включение fieldata в мое текстовое поле и выполнение простой агрегации терминов, но документация, похоже, настоятельно предупреждает против включения fielddata.
Большое спасибо.