Любое предложение, кроме Solr н-грамм - PullRequest
0 голосов
/ 21 декабря 2011

Я использую Solr 3.5, но я столкнулся с проблемой.Я хочу сравнить каждую строку в файле1 со ссылкой, указанной в файле2.Но в file1 данные не обязательно пишутся правильно.Поэтому я решил использовать nGram, чтобы сократить слова по буквам от 3 до 15. Проблема в том, что, когда я сокращаю слова на 3, слишком много совпадений;но если сократить на 15, совпадения не будет :( Кто-нибудь, у кого есть идея решить эту проблему?

Спасибо! Бо

1 Ответ

0 голосов
/ 21 декабря 2011

Вы можете попробовать использовать компонент проверки орфографии. Используйте поле file2 в качестве словаря. см. учебник http://wiki.apache.org/solr/SpellCheckComponent

...