Я только что узнал о записи в Python и преобразовал ее в текст, используя Speech_Recognition.Recognizer()
, но мне интересно, как установить время между молчанием и обнаружением того, что я говорю, например, я говорю целую газету, которая мне нужна несколько секунд, чтобы отдохнуть, как я вижу, listen()
остановится, когда я немного не буду говорить, или просто как мне ручное управление, когда нужно остановить запись?
import speech_recognition as sr
r=sr.Recognizer()
mic=sr.Microphone()
with mic as source:
audio=r.listen(source)
print(r.recognize_google(audio))