Распознавание речи в веб-браузере - PullRequest
0 голосов
/ 26 октября 2010

Как реализовать распознавание речи в Интернете через интерфейс веб-браузера.

Возможно ли реализовать это без использования потокового сервера (полностью браузерного приложения)? Без создания каких-либо собственных плагинов можно ли реализовать распознавание речи с помощью Flash ...

Ответы [ 3 ]

2 голосов
/ 27 октября 2010

Я не верю, что есть поддержка HTML для захвата аудио.Существует рабочая группа, которая выпустила http://www.w3.org/TR/xhtml+voice/, но я не верю, что это реализовано в любом браузере, кроме Opera (см. http://dev.opera.com/articles/voice/).

. Вы можете посмотреть на инструментарий WAMI. Инструментарий WAMI - этоинтересный проект от MIT - http://wami.csail.mit.edu/. По их собственным словам «WAMI: мультимодальные приложения, доступные через Интернет. WAMI - это простой способ добавить возможности распознавания речи на любую веб-страницу». WAMI предоставляет вам Java-апплет, который может работать вваша веб-страница для выполнения захвата звука для распознавания речи. В их примерах распознавание выполняется на сервере.

Я подозреваю, что можно использовать Flash, ActiveX или Java в браузере и запускать локальное распознавание речи изнутри вашеговеб-страницы. Однако вам потребуется установить механизм распознавания (или убедиться, что он доступен).

0 голосов
/ 17 декабря 2016

pocketsphinx работает, но недостаточно хорош для обработки нескольких слов, а точность низкая.CSharp превосходен, но его нелегко развернуть на веб-странице.Для хороших услуг требуются удаленные серверы (Bing API, Google API и т. Д.).

0 голосов
/ 06 августа 2013

Я не думаю, что это возможно;Используя Flash, вы, безусловно, можете захватывать звук с микрофона пользователя, но на данный момент за пределами WebKit не доступно ничего, обеспечивающего распознавание на уровне браузера.

Примечание:

Прямо сейчас, как часть HTML5В спецификациях есть атрибут x-webkit-speech, который вы можете привязать к элементу <input> - вы могли видеть это в действии в Google Translate.Кажется, это лучший вариант без Flash.

Я нашел http://caniuse.com/#feat=audio-api, чтобы отследить, что возможно, откуда этот комментарий к закрытому вопросу.

...