В Lucene, в чем разница между ANALYZED и ANALYZED_NO_NORMS? - PullRequest
7 голосов
/ 22 июля 2011

Я не мог понять разницу между двумя способами индексации: ANALYZED и ANALYZED_NO_NORMS. Я прочитал Lucene Javadoc, но не понял разницы.

Может кто-нибудь рассказать мне больше о НОРМАХ? Каковы преимущества или ограничения, которые они приносят при индексировании?

1 Ответ

12 голосов
/ 22 июля 2011

анализируемом

Индексировать токены, полученные путем запуска значения поля через анализатор. Это полезно для обычного текста. Анализатор может быть чем-то вроде Snowball Stemmer Analyzer:

ANALYZED_NO_NORMS

Использует анализатор, однако он не создает норм для полей.

Нормы создаются для быстрой оценки документов во время запроса. Эти нормы обычно все загружаются в память, поэтому при запуске анализатора запросов по индексу он может быстро оценить результаты поиска.

Нормы не означают, что индексное время, усиление поля документа и нормализация длины поля отключены. Преимущество заключается в меньшем использовании памяти, так как во время поиска нормам требуется один байт ОЗУ на индексированное поле для каждого документа в индексе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...