Как посчитать наиболее встречающееся слово из набора документов, а затем выполнить подгруппы - PullRequest
1 голос
/ 28 октября 2019

Из запроса Elasticsearch я могу создать, скажем, около 5000 документов. Теперь я пытаюсь определить, какие безостановочные слова (стоп-слова являются вспомогательными глаголами / несущественными словами)наиболее часто встречается для меня

enter image description here

Мои вопросы:
1. Есть ли альтернатива агрегации significant_text?

Я также хочу выполнить субагрегацию terms после этой significant_text основной агг, потому что я хочу объединить запрос, чтобы узнать популярные слова, а затем отфильтровать документы по другим полям

Буду очень признателен, если у вас есть идея, как выполнить этот желаемый процесс и вывести

...