Вам нужно использовать enums.RecognitionConfig.AudioEncoding.LINEAR16
, это идеально подходит для wav
расширений. Я вижу, что ваша частота дискретизации составляет 22050, что не сработает, вам нужно сделать частоту дискретизации 16000
. Также я столкнулся с проблемой, когда моя битовая глубина не была установлена на 16, поэтому, пожалуйста, установите битовую глубину на 16, с этими изменениями она будет работать. Если вы используете sox, это можно сделать довольно легко. Ниже представлена команда sox для изменения частоты дискретизации и битовой глубины.
sox audio.wav -r 16000 -c 1 -b 16 audio_1.wav bandreject 200 3k
Я реализовал полосовой фильтр, используя bandreject
, вы можете удалить эту часть, если не требуется.