Нечеткий алгоритм поиска для западноевропейских языков (в моем случае шведский) - PullRequest
3 голосов
/ 15 августа 2010

Я ищу нечеткую реализацию поиска, которая хорошо работает с западноевропейскими языками.

Какой алгоритм работает лучше всего и где я могу найти реализацию в C #?

Обновление

Soundex адаптирован к шведскому языку:

Реализация NYSSIS:

Левенштейн:

Впечатляющая библиотека Java:

Но я до сих пор не знаю, какой из них лучше для западноевропейских языков

Ответы [ 2 ]

1 голос
/ 15 августа 2010

Soundex - это хорошо известный алгоритм для сопоставления похожих звучащих слов.Поищите в Google «soundex c #», чтобы найти бесконечный список подходящих реализаций и объяснений.

Возможно, вам придется сопоставить å, ä, ö с a, a, o, если это не включено в выбранный вами код.

0 голосов
/ 01 сентября 2010

Я выбрал NYSSIS.

...