API речи к тексту (НЕ МОБИЛЬНЫЙ) - PullRequest
1 голос
/ 14 октября 2011

Я пытаюсь написать программу, которая принимает звук от пользователя через микрофон, а затем преобразует сказанное в текст для дальнейшей манипуляции.

Я знаю, что в Google есть такая вещь, но она предназначена для разработчиков Android, и я пытаюсь сделать что-то более похожее на расширение Chrome (расширение, которое я предусмотрел, - это расширение Chrome, но я открыт для альтернатив).

Я посмотрел на Mac OSX NSSpeechRecognizer, но мне нужно что-то более всестороннее, так как для этого необходимо заранее указать ограниченный грамматик.

Я не могу ожидать или предсказать, что мои пользователи скажут в микрофон (но я МОГУ предположить, что это будет английский).

1 Ответ

3 голосов
/ 21 октября 2011

У Google есть неофициальный API, который можно использовать, как описано в этом посте: http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

Если вы пишете расширение для Chrome, вы можете использовать тег вроде:

<input type="text" x-webkit-speech />

, который добавляет кнопку микрофона и использует облачное распознавание речи Google, чтобы заполнить текстовое поле тем, что говорит пользователь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...