Вам нужен аналог браузера, который знает, как обрабатывать VoiceXML.
Я работаю в телекоммуникационной отрасли, так что обычно это программное обеспечение, которое подключается к телефонной сети общего пользования либо через одно из телефонных соединений старого стиля, либо через VoIP. В этой области существует множество коммерческих и открытых решений.
Существуют и другие реализации, такие как Opera и некоторые исследовательские инициативы в области доступности, но я не видел, чтобы они получили много основания.
Я бы не рассматривал VoiceXML как самый простой способ приблизиться к распознаванию речи. Тем не менее, не существует простых способов и бесплатных решений с открытым исходным кодом. Самый простой путь на платформе Microsoft - взглянуть на уровень Microsoft SAPI и бесплатный, минимальный ASR, который они предоставляют. На стороне Linux, проверьте CMU Sphinx .