Как подсчитать каждое вхождение термина PER DOCUMENT в apache SOLR? - PullRequest
0 голосов
/ 15 сентября 2018

Хорошо! Мне нужно получить количество вхождений поискового запроса для каждого документа, хранящегося в Solr (я проиндексировал документы "PDF").
То есть, если у вас есть следующая информация:

  • документ A: 3 раза появляется слово «дом».
  • документ B: слово «дом» появляется 4 раза.
  • документ C: слово «дом» встречается 1 раз.

Итак, если я ищу «дом», мне нужно получить, что для документа A он появляется 3 раза, для B 4 раза и для C 1 раз. И всего 8 раз (3 + 4 + 1). Как я могу сделать это в запросе от HTTP, то есть "'http: // localhost: 8983 / solr / ......."?
Большое спасибо, С уважением.

1 Ответ

0 голосов
/ 17 сентября 2018

Я предполагаю, что вы проиндексировали весь документ в одно поле (например, текст). В этом случае вы можете использовать запрос функции termfreq , чтобы возвращать число раз, когда ваш термин появляется в этом поле.

Существует несколько способов использовать запрос функции, в том числе использовать его в качестве псевдополя, просто поместив его в список полей fl :

http://localhost:8983/solr/corename/select?fl=*,termfreq(text,"house")&q=house

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...