Во-первых, вам требуется следующее, установленное в вашей системе. 1. Python 2. Пакет распознавания речи 3. PyAudio
Теперь вы можете запустить этот код, чтобы узнать свою версию
import speech_recognition as s_r
print(s_r.__version__)
Выход
3.8.1
Будет распечатана текущая версия пакета распознавания речи.
Затем установите микрофон для приема звука:
my_mic = s_r.Microphone()
Здесь вы должны передать параметр device_index =?
Чтобы распознать ввод с микрофона, вы должны использовать класс распознавателя. Давайте просто создадим его.
r = s_r.Recognizer()
Теперь я преобразую звуковую речь в текстовый Python
Чтобы преобразовать с помощью распознавания речи Google, мы можем использовать следующую строку:
r.recognize_google(audio)
Возвращает строку с некоторыми текстами. (Он преобразует ваш голос в текст и возвращает его в виде строки.
Вы можете просто напечатать его, используя следующую строку:
print(r.recognize_google(audio))
Теперь полная программа будет выглядеть следующим образом:
import speech_recognition as s_r
print(s_r.__version__) # just to print the version not required
r = s_r.Recognizer()
my_mic = s_r.Microphone(device_index=1) #my device index is 1, you have to put your device index
with my_mic as source:
print("Say now!!!!")
audio = r.listen(source) #take voice input from the microphone
print(r.recognize_google(audio)) #to print voice into text
Если вы запустите это, если получите выход.
Но, подождав несколько секунд, если вы не получите никакого вывода, проверьте ваше соединение inte rnet.