Так как никто не может ответить на этот вопрос, после нескольких месяцев поиска я узнал сам. Язык, который можно использовать, это либо чистый Matlab для обработки изображений, либо синхронизация губ (однако в Matlab это сложно из-за отсутствия многопоточность, но все еще может быть выполнена с использованием TimerFcn).
Здесь можно использовать Java как язык, но обработка изображений и звука немного сложна в Java.
Flash - это язык, который можно использовать лучше всего подходит для этого типа обработки, хотя я сомневаюсь, что он удовлетворяет критерию «языка программирования».
присутствуют другие легкодоступные инструменты, которые могут использоваться для реализации проекта.