Question

Меня немного смущает уровень интеграции между Lucene.NET и RavenDB. Lucene поддерживает грамматический и фонетический анализ текстов (например, слово «stemming», «Метафон»), что позволяет выполнять поиск, который соответствует документу на основе сходства. Теперь Lucene используется для запроса индексов, а также из того, что я взял из документации, а также для их построения (см. http://ravendb.net/documentation/docs-http-indexes-querying, последний раздел).

Однако, анализаторы Lucene, которые обеспечивают грамматический и фонетический анализ, похоже, не работают. Или они и мне не хватает переключателя? Или есть способ установить / создать плагин для добавления анализаторов текста в RavenDB?

Matt Warren · Answer 1 · 08 июля 2010

В настоящее время настроить анализатор невозможно, см. эту ветку для более подробного обсуждения.

Если вы принимаете участие в обсуждении здесь , оно может быть добавлено. Вы не первый человек, который просил об этом поведении.

Одним из возможных решений является предварительная идентификация или анализ теста самостоятельно. Поэтому в индекс добавляется модифицированный текст. Например, вы можете изменить «запустить» на «запустить работает бегун» и т. Д. Тогда поиск «работает» найдет ваш документ. Существует также нечеткий поиск, который может помочь, см. здесь для получения дополнительной информации

Обновление эта функциональность была добавлена в RavenDB, подробнее см. здесь

RavenDB: Грамматический и фонетический анализ?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

RavenDB: Грамматический и фонетический анализ?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы