Lucence SweetSpotСхожесть длинаНорма - PullRequest
0 голосов
/ 08 июля 2010

http://lucene.apache.org/java/2_3_0/api/org/apache/lucene/misc/SweetSpotSimilarity.html

Реализуется как: 1 / sqrt (крутизна * (abs (x-min) + abs (x-max) - (max-min)) + 1).

Это ухудшается до 1 / sqrt (x), когда min и max равны 1, а крутизна равна 0.5

Может кто-нибудь объяснить эту формулу для меня?Как определяется крутизна и что именно означает?

Любая помощь приветствуется.

1 Ответ

0 голосов
/ 09 июля 2010

При использовании параметра По умолчанию, чем короче поле с точки зрения количества токенов, тем выше оценка.

например. если у вас есть два документа со индексированными значениями полей «быстрая коричневая лиса» и «коричневая лиса» соответственно, последний получит более высокий балл в запросе «лиса».

SweetSpotSimility позволяет вам определить «точку отсчета» для длины поля в терминах диапазона, определенного min и max. Длины полей в пределах диапазона будут равны, а длины полей вне диапазона будут меньше, в зависимости от расстояния, на котором длина образует границу диапазона. «крутизна» определяет, насколько быстро оценка ухудшается как функция расстояния.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...