Я не понимаю, как преобразовать непрерывную речь в текст, используя Google Cloud API на рабочем столе Windows.
Я попробовал образец распознавания речи с Google, Google Cloud и Sphinx. С помощью Google я могу преобразовать только короткую речь (до 10 секунд) в текст. Сфинкс работает намного лучше, но качество распознавания очень плохое по сравнению с Google.
Это стандартный код, который я нашел здесь:
https://github.com/Uberi/speech_recognition/blob/master/examples/microphone_recognition.py
Результаты фактического распознавания в порядке, но это не решает проблему непрерывного распознавания речи.
Я нашел образцы асинхронного распознавания речи через сервис Google Clour, но все они основаны на аудиофайле, а не на микрофоне