Возможно ли использовать Android API вне проекта Android? - PullRequest
1 голос
/ 27 апреля 2011

Точнее говоря, возможно ли для не-Android-приложения Java использовать распознавание речи Android. Я подумал, что мог бы использовать cmu sphinx или что-то подобное, но вся отправка голосового ввода на сервер, который выполняет реальное распознавание и возвращает массив строк, кажется намного проще в настройке, что уменьшает размер проекта. Также, если это возможно, проект сможет использовать (огромный) речевой корпус Google.

Ответы [ 2 ]

3 голосов
/ 27 апреля 2011

Более конкретно, возможно ли для не-Android-приложения Java использовать распознавание речи Android.

Нет. AFAIK, это не с открытым исходным кодом.

0 голосов
/ 27 апреля 2011

См. https://stackoverflow.com/questions/5613167/source-code-for-the-googles-voice-search-activity/5621683#5621683

Из этой ветки:

Я не знаю, доступны ли источники Android, но Google обновил Chrome, чтобы включить распознавание речи, и эти источники доступны.Я не думаю, что Google хочет, чтобы люди вызывали эту услугу напрямую, и, вероятно, нарушает некоторые условия обслуживания где-то еще, но посмотрите http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/, чтобы увидеть службу распознавания речи Chrome, которая, как я подозреваю, похожана Android.

Как сказано в этой статье:

http://src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech/

Похоже, что звук собирается с микрофона, а затем передается через HTTPS POSTна веб-службу Google, которая отвечает с объектом JSON с результатами.Просматривая код аудиокодера, кажется, что звук может быть либо FLAC, либо Speex, но похоже, что это какая-то специально модифицированная версия Speex. Я не уверен, что это такое, но это не выглядело достаточноправо.

Также см. Служба распознавания речи Google для голосового поиска - она ​​может содержать несколько полезных ссылок на информацию.

В качестве альтернативы существуют коммерческие службы распознавания речи.см. http://yapme.com/speech-cloud.html, Nuance, http://www.ispeech.org/developers, и другие, перечисленные в Распознавание голоса на стороне сервера .

...