Question

Я не мог понять разницу между двумя способами индексации: ANALYZED и ANALYZED_NO_NORMS. Я прочитал Lucene Javadoc, но не понял разницы.

Может кто-нибудь рассказать мне больше о НОРМАХ? Каковы преимущества или ограничения, которые они приносят при индексировании?

Justin Shield · Answer 1 · 22 июля 2011

анализируемом

Индексировать токены, полученные путем запуска значения поля через анализатор. Это полезно для обычного текста. Анализатор может быть чем-то вроде Snowball Stemmer Analyzer:

http://e -mats.org / 2009/05 / модифицируя-а-Lucene-снежок-парадигматический /

ANALYZED_NO_NORMS

Использует анализатор, однако он не создает норм для полей.

http://lucene.apache.org/java/2_4_0/scoring.html

Нормы создаются для быстрой оценки документов во время запроса. Эти нормы обычно все загружаются в память, поэтому при запуске анализатора запросов по индексу он может быстро оценить результаты поиска.

Нормы не означают, что индексное время, усиление поля документа и нормализация длины поля отключены. Преимущество заключается в меньшем использовании памяти, так как во время поиска нормам требуется один байт ОЗУ на индексированное поле для каждого документа в индексе.

В Lucene, в чем разница между ANALYZED и ANALYZED_NO_NORMS?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

В Lucene, в чем разница между ANALYZED и ANALYZED_NO_NORMS?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов