RavenDB: Грамматический и фонетический анализ? - PullRequest
4 голосов
/ 07 июля 2010

Меня немного смущает уровень интеграции между Lucene.NET и RavenDB. Lucene поддерживает грамматический и фонетический анализ текстов (например, слово «stemming», «Метафон»), что позволяет выполнять поиск, который соответствует документу на основе сходства. Теперь Lucene используется для запроса индексов, а также из того, что я взял из документации, а также для их построения (см. http://ravendb.net/documentation/docs-http-indexes-querying, последний раздел).

Однако, анализаторы Lucene, которые обеспечивают грамматический и фонетический анализ, похоже, не работают. Или они и мне не хватает переключателя? Или есть способ установить / создать плагин для добавления анализаторов текста в RavenDB?

1 Ответ

3 голосов
/ 08 июля 2010

В настоящее время настроить анализатор невозможно, см. эту ветку для более подробного обсуждения.

Если вы принимаете участие в обсуждении здесь , оно может быть добавлено. Вы не первый человек, который просил об этом поведении.

Одним из возможных решений является предварительная идентификация или анализ теста самостоятельно. Поэтому в индекс добавляется модифицированный текст. Например, вы можете изменить «запустить» на «запустить работает бегун» и т. Д. Тогда поиск «работает» найдет ваш документ. Существует также нечеткий поиск, который может помочь, см. здесь для получения дополнительной информации

Обновление эта функциональность была добавлена ​​в RavenDB, подробнее см. здесь

...