Я бы предложил использовать алгоритм двойного метафона для MySQL в этом случае. Двойной Метафон предназначен для решения проблем, связанных со словами из разных корневых языков. Он основан на метафоне, который был разработан, чтобы исправить некоторые недостатки Soundex. Вот ссылка на сайт Double Metaphone, где вы можете узнать больше об этом, а также увидеть примеры на нескольких языках, включая MySQL:
http://www.atomodo.com/code/double-metaphone