Есть ли способ отправить аудиофайл на распознавание речи в текст? - PullRequest
15 голосов
/ 16 ноября 2010

Я хочу, чтобы система распознавания речи Android анализировала аудиофайл, а не входящий голос по умолчанию с микрофона.

Есть ли способ сделать это?

Спасибо.

Ответы [ 2 ]

1 голос
/ 08 октября 2014

cmusphinx.sourceforge.net / wiki / tutorialandroid Только что обнаружил, что ссылка звучит так, как будто кто-то создал версию Sphinx для Android.

Глядя на API Android, похоже, что это не поддерживается.(http://developer.android.com/reference/android/speech/package-summary.html)

Возможно, вы сможете использовать другой API.

Я знаю, что Microsoft C # api позволяет это, но для того, чтобы это было полезно, вам, вероятно, потребуется настроить сервер сПрограмма, которую вы написали, записывает звуковой файл на телефон, а затем отправляет его на сервер.

CMUSphinx (http://cmusphinx.sourceforge.net/wiki/) написан на Java, поэтому может быть возможно запустить его на устройстве AndroidНа этом API вы создаете StreamSpeechReconizer.

StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
recognizer.startRecognition(new File("speech.wav").toURI().toURL());
SpeechResult result = recognizer.getResult();
recognizer.stopRecognition();

Я нашел это https://gist.github.com/alotaiba/1730160 с помощью быстрого веб-поиска (Google "распознавание речи, API принимает файл"), так что могут быть другиесеть, которая будет принимать файл для отправки.

1 голос
/ 05 мая 2013

Полагаю, он работает аналогично Chrome API - http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

Как он упомянул, вы можете преобразовать файл микрофона в файл .flac и отправить его в речь API, и вы получите тот же результат. Таким образом, вы можете использовать SOX и конвертировать его самостоятельно.

Надеюсь, это поможет. Dias

...