Я использовал Google речь для текстового API, но его время отклика очень медленное, я также использовал Pocketsphinx из Python, но это не так точно.
Я хочу что-то, что преобразует речь в текст в течение 1-2 секунд.
Вот код: -
def listen():
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("how can i help you?")
audio = r.listen(source)
text = r.recognize_google(audio)
return text
command=listen()