Рассчитать количество элементов массива, которые повторяются в диапазоне (100-1000) в Solr - PullRequest
0 голосов
/ 26 мая 2019

У меня есть поле в коллекции Solr, это массив, как в следующем примере:

"hashtag": [
    "#a"
     "#b"
     "#c"
     "#d"
]

аспект этого поля похож на любимый:

[
    "#a": 1000,
    "#b": 970,
    "#c": 960,
    "#d": 950,
    "#e": 850
    ....
]

Я хочу рассчитать количество хэштегов, которые повторяются между 900-1000 раз в приведенном выше примере "#a", "# b", "# c", "# d" повторяются между 900-1000 раз, что означает 4 хэштега

Этот счет может быть очень большим Я хочу такой ответ:

{
    "*-100"     : 241
    "100-1000"  : 521,
    "1000-10000": 251,
    "10000-*"   : 854
}

Я хочу преобразовать этот запрос в solr

Как я могу это сделать?

1 Ответ

0 голосов
/ 27 мая 2019

Хотя это не даст вам счет, вы можете использовать Компонент Условий , чтобы получить все хештеги (.. но не получить просто количество):

term.mincount

Указывает минимальную частоту возврата документа для включения термина в ответ на запрос.Результаты включают mincount (то есть> = mincount).

term.maxcount

Указывает максимальную частоту документов, которую должен иметь термин, чтобы быть включеннымв ответе на запрос.По умолчанию установлено значение -1, которое не устанавливает верхней границы.Результаты включают maxcount (т. Е. <= Maxcount). </p>

Ваш полный запрос будет выглядеть примерно так:

http://../solr/<core>/terms?terms.fl=extracted_hashtag&wt=xml
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...