Я знаю, что soundex в более старых версиях SQLServer игнорировал любые неанглийские символы. Я полагаю, что он даже не работал с Latin-1, не говоря уже о чем-нибудь более экзотическом.
Я никогда не имел дело с soundex в SQL2k, все, что я точно знаю, это то, что он неправильно обрабатывает арабский язык. Это, вероятно, распространяется и на другие нелатинские наборы символов.
В любом случае алгоритм на основе soundex вряд ли даст приемлемые результаты для неанглийских языков, даже если не учитывать проблемы с набором символов. Soundex был специально разработан для обработки английского произношения имен (в основном, западноевропейского происхождения) и не особенно хорошо работает за пределами этого использования. Вам часто было бы лучше исследовать любой из нескольких вариантов soundex или других не связанных между собой алгоритмов фонетического сходства, которые разработаны с учетом рассматриваемого языка (языков).