О модификации алгоритма счета Whoo sh - PullRequest
0 голосов
/ 26 апреля 2020

У меня есть 2 вопроса о whoo sh, надеюсь, кто-нибудь может мне помочь.

(1) Как я могу получить количество уникальных предметов в заданных документах, похоже, что функция «doc_field_length» могла бы поддерживать только общее количество токенов в заданных документах. (2) Как я могу получить номер запроса, например, когда запрос "банановое яблоко животное", число должно быть 3.

Так как я бы разработал новый метод оценки вместо исходного "BM25"

My whoo sh версия 2.7.4, python 3.5.6 Большое спасибо

...