длина документа в люцене 4.0 - PullRequest
0 голосов
/ 09 марта 2012

, как я прочитал документацию по lucene 4.0, теперь эта библиотека хранит некоторую статистику для вычисления различных моделей скоринга, одна из которых bm25. Есть ли способ, кроме получения документа, также получить его длину?

1 Ответ

2 голосов
/ 09 марта 2012

Вы можете хранить все, что вы хотите, из FieldInvertState в 'norm', и это не обязательно должно быть 8-битное значение с плавающей запятой.

По умолчанию используется хранилище данных с потерями, если вы хотитефактическая точная длина, может быть, вы решили использовать короткую (16 бит) для документа или что-то еще вместо этого.

См. Similarity.computeNorm

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...