Question

Я пытаюсь написать программу, которая принимает звук от пользователя через микрофон, а затем преобразует сказанное в текст для дальнейшей манипуляции.

Я знаю, что в Google есть такая вещь, но она предназначена для разработчиков Android, и я пытаюсь сделать что-то более похожее на расширение Chrome (расширение, которое я предусмотрел, - это расширение Chrome, но я открыт для альтернатив).

Я посмотрел на Mac OSX NSSpeechRecognizer, но мне нужно что-то более всестороннее, так как для этого необходимо заранее указать ограниченный грамматик.

Я не могу ожидать или предсказать, что мои пользователи скажут в микрофон (но я МОГУ предположить, что это будет английский).

Crashthatch · Answer 1 · 21 октября 2011

У Google есть неофициальный API, который можно использовать, как описано в этом посте: http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

Если вы пишете расширение для Chrome, вы можете использовать тег вроде:

<input type="text" x-webkit-speech />

, который добавляет кнопку микрофона и использует облачное распознавание речи Google, чтобы заполнить текстовое поле тем, что говорит пользователь.

API речи к тексту (НЕ МОБИЛЬНЫЙ)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

API речи к тексту (НЕ МОБИЛЬНЫЙ)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы