Я работаю над проектом Virtual Assistant, который распознает речь, затем преобразует ее в текст и выполняет инструкции в соответствии с речью.
Теперь моя проблема в том, что речь никогда не распознает ни одного слова, которое я говорю, нет ошибок выскакивают. однако, когда я распечатываю распознанную речь, она всегда пуста.
см. следующий код:
import wikipedia
import webbrowser
import speech_recognition as sr
import pyttsx3
import subprocess
import os
from gtts import gTTS
import datetime
import warnings
import calendar
import random
import pyaudio
#ignore warnings
warnings.filterwarnings('ignore')
def record_audio():
#record
r = sr.Recognizer() #creating recognizer object
#open the mic and record
with sr.Microphone() as source:
print('say somthing!')
audio = r.listen(source)
#use google speech recognition
data = ''
try:
date = r.recognize_google(audio)
print('you said: '+data)
except sr.UnknownValueError:
print('google cant understand the audio !')
except sr.RequestError as e:
print('request results from google speech recognition service error '+ e)
return data
record_audio()
вывод всегда соответствует приведенному ниже:
вы сказал:
что я пытался решить это:
r.adjust_for_ambient_noise(source, duration=1)
в терминале: pip install pipwin
ничего из вышеперечисленного не сработало.
отступы все в порядке, это просто форматирование потока.