Solr наиболее часто встречающиеся слова в текстовом поле - PullRequest
0 голосов
/ 20 апреля 2020

Я знаю, что мы можем получить наиболее часто встречающиеся слова, используя Компонент терминов в Solr.

Но компонент терминов работает на уровне терминов, и мы не можем использовать его вместе с запросом фильтра (поправьте меня, если я ' м неправильно), то есть всегда возвращает самые частые слова во всей коллекции. Я пытаюсь найти наиболее часто встречающиеся слова в наборе результатов после применения фильтра.

Мы можем сделать это путем огранки над текстовым полем, так как оно имеет токены, слова в фасетных результатах будут иметь каждое слово и сосчитать. Проблема этого подхода в том, что у текстовых полей не может быть значений docValues, поэтому при большой мощности это становится очень дорогим запросом.

Поэтому мой вопрос заключается в том, как быстро получить наиболее часто встречающиеся слова в текстовом поле, как в Компоненты условий, но также применять фильтр до получения результатов?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...