Предложения Дейва - отличное начало. Сфинкс очень изящен.
Я просто хочу добавить, что вы должны быть максимально вероятностными. Как одноразовый лингвист и даже более ранний любитель фонологии, я могу с уверенностью сказать, что не увлекайтесь лингвистическими моделями. Давайте не будем забывать о том, что часто ошибочно приписывают «каждый раз, когда я увольняю лингвиста, моя точность повышается». На самом деле речь идет о модели и ее способностях учитывать шум и вариации, а не то, что может сказать специалист по гуманитарным наукам из Массачусетского технологического института.
Хорошая книга, которую можно взять в руки, была бы "Обработка речи и языка" Юрафски и Мартина. Он имеет несколько очень полезных приложений вычислительных моделей для решения этой задачи. Работа Харви Суссмана над линейными коррелятами на склонах F2 для различных гласных (начиная с сов сарая и направляясь к людям), кажется, было бы неплохо внедрить в модель на днях.