Я знаю, что мы можем получить наиболее часто встречающиеся слова, используя Компонент терминов в Solr.
Но компонент терминов работает на уровне терминов, и мы не можем использовать его вместе с запросом фильтра (поправьте меня, если я ' м неправильно), то есть всегда возвращает самые частые слова во всей коллекции. Я пытаюсь найти наиболее часто встречающиеся слова в наборе результатов после применения фильтра.
Мы можем сделать это путем огранки над текстовым полем, так как оно имеет токены, слова в фасетных результатах будут иметь каждое слово и сосчитать. Проблема этого подхода в том, что у текстовых полей не может быть значений docValues, поэтому при большой мощности это становится очень дорогим запросом.
Поэтому мой вопрос заключается в том, как быстро получить наиболее часто встречающиеся слова в текстовом поле, как в Компоненты условий, но также применять фильтр до получения результатов?