Это ответ на этот вопрос.Вы должны установить pyaudio и SpeechRecognition.и формат аудиофайла должен быть в WAV-файле .
Код для преобразования речи в текст (ввод из аудиофайла).
import speech_recognition as sr
r = sr.Recognizer()
audio = 'trial.wav'
with sr.AudioFile(audio) as source:
audio = r.record(source)
print ('Done!')
try:
text = r.recognize_google(audio)
print (text)
except Exception as e:
print (e)