Что такое VoiceXML? - PullRequest
       30

Что такое VoiceXML?

1 голос
/ 10 марта 2010

При поиске способа использования распознавания речи со вспышкой я пересек пути с VoiceXML. Я прошел через описание W3C, но все же у меня возникло несколько больших сомнений.

Могу ли я просто создать документ VXML и разместить его на своем веб-сервере? какие требования?

Будет ли это работать?

Можно ли вводить через микрофон через Интернет?

Кажется, я не могу найти на это прямой ответ.

Ответы [ 2 ]

1 голос
/ 20 марта 2010

VoiceXML - это способ разметки контента, предназначенного для доставки по голосу, обычно по телефону. Так же, как HTML - это способ форматирования контента, который вы хотите отобразить через веб-браузер, так и VoiceXML - это способ доставки его на телефон.

VoiceXML сам по себе не распознает речь. Но многие провайдеры VoiceXML также объединяют механизм распознавания речи (также известный как ASR) со своей платформой VoiceXML.

Если вы ищете способ распознавания голосового ввода, исходящего от микрофона вашего компьютера, в какое-то настольное приложение, то VoiceXML, вероятно, не то, что вам нужно.

В Википедии есть список некоторых программ для распознавания речи на http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Если вы хотите узнать больше о VoiceXML, есть хорошая документация на http://vxml.org/

1 голос
/ 11 марта 2010

Вам нужен аналог браузера, который знает, как обрабатывать VoiceXML.

Я работаю в телекоммуникационной отрасли, так что обычно это программное обеспечение, которое подключается к телефонной сети общего пользования либо через одно из телефонных соединений старого стиля, либо через VoIP. В этой области существует множество коммерческих и открытых решений.

Существуют и другие реализации, такие как Opera и некоторые исследовательские инициативы в области доступности, но я не видел, чтобы они получили много основания.

Я бы не рассматривал VoiceXML как самый простой способ приблизиться к распознаванию речи. Тем не менее, не существует простых способов и бесплатных решений с открытым исходным кодом. Самый простой путь на платформе Microsoft - взглянуть на уровень Microsoft SAPI и бесплатный, минимальный ASR, который они предоставляют. На стороне Linux, проверьте CMU Sphinx .

...