Я бы, вероятно, оценил каждое слово, используя алгоритм SOUNDEX, по базе данных английских слов. Если вы делаете это на SQL-сервере, вам будет довольно легко настроить базу данных, содержащую список большинства английских слов (используя свободно доступный словарь), а на сервере MSSQL SOUNDEX реализован как доступный алгоритм поиска.
Очевидно, что вы можете реализовать это самостоятельно, если хотите, на любом языке - но это может быть довольно сложной задачей.
Таким образом, вы получите оценку того, насколько каждое слово звучит как существующее английское слово, если таковое имеется, и вы можете установить некоторые пределы для того, насколько низко вы хотите принимать результаты. Возможно, вы захотите подумать о том, как объединить результаты для нескольких слов, и вы, возможно, настроите пределы приемлемости, основанные на тестировании.