Lucene, использующий Snowball и SpellChecker, возвращает странные значения - PullRequest
0 голосов
/ 02 декабря 2009

Я пытаюсь настроить SpellChecker с помощью Lucene.NET, все работает отлично, за исключением ситуаций, подобных следующим:

У меня есть текст, содержащий спутник в индексе, я анализирую его с помощью Snowball.

Затем я создаю индекс SpellChecker и получаю предложения от него. Предложение, которое я получаю, когда возвращаюсь в "Satalite", является "Satellit".

Я предполагаю, что это потому, что Снежок опускает Спутник на спутник и, следовательно, SpellChecker возвращает его в качестве предложения.

Есть ли что-нибудь вокруг этого, так что я могу использовать оба вместе, кроме создания дополнительного поля для неосновных слов, просто чтобы проверка правописания могла это проверить?

Ответы [ 2 ]

0 голосов
/ 14 февраля 2011

Рассматривали ли вы использование слов, генерируемых фильтром снежного кома, как синонимов? В этом направлении я иду ... не знаю, насколько хорошо это будет работать, но кажется правдоподобным. Затем проверка орфографии вернет правильные слова, но я все еще могу выполнить свои поиски и найти найденный вариант.

0 голосов
/ 29 декабря 2009

Как упоминалось выше Шашикантом:

Вы правы, это происходит из-за остановки. К сожалению, стволовые слова предназначены не только для поиска, а для внешнего поиска они могут быть бессмысленными Даже я не знаю другой техники, кроме как хранить ее несколько раз. Это дополнительное поле может быть сконфигурировано так, чтобы хранить как можно меньше информации, чтобы уменьшить нагрузку. - Шашикант Коре 2 декабря в 14: 08

...