Question

Я не понимаю, как преобразовать непрерывную речь в текст, используя Google Cloud API на рабочем столе Windows.

Я попробовал образец распознавания речи с Google, Google Cloud и Sphinx. С помощью Google я могу преобразовать только короткую речь (до 10 секунд) в текст. Сфинкс работает намного лучше, но качество распознавания очень плохое по сравнению с Google.

Это стандартный код, который я нашел здесь: https://github.com/Uberi/speech_recognition/blob/master/examples/microphone_recognition.py

Результаты фактического распознавания в порядке, но это не решает проблему непрерывного распознавания речи. Я нашел образцы асинхронного распознавания речи через сервис Google Clour, но все они основаны на аудиофайле, а не на микрофоне

duskwuff · Answer 1 · 20 мая 2019

Непрерывное распознавание речи - это особая и сложная задача, для которой требуется распознаватель, специально созданный для этой задачи.

Ни один из веб-API, используемых в примере кода, который вы связали (API Google Cloud и т. Д.), Не поддерживает непрерывное распознавание речи. Они не могут быть использованы для этой цели.

Непрерывное распознавание речи с микрофоном с использованием библиотеки распознавания речи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Непрерывное распознавание речи с микрофоном с использованием библиотеки распознавания речи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы