Как сделать Международный Soundex? - PullRequest
16 голосов
/ 24 сентября 2008

например. алгоритм Soundex оптимизирован для английского языка. Существует ли более универсальный алгоритм, который применим к большим семействам языков?

1 Ответ

15 голосов
/ 24 сентября 2008

SOUNDEX действительно ориентирован на английский язык. Двумя другими, которые принимают во внимание более широкий спектр фонетических различий, являются: двойной метафон и NYSIIS .

Они производят кодировки в гораздо большее возможное пространство, чем SOUNDEX. Double Metaphone, в частности, включает сокращения с явной целью обработки альтернативных произношений, основанных на большем количестве языков, чем английский.

Я недавно провел презентацию по нечеткому сопоставлению строк, слайды могут быть полезны.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...