Вариант использования : я положил телефон на динамик, набрал номер службы поддержки клиентов, записал автоматическое голосовое сообщение на своем ноутбуке, теперь я хочу преобразовать его в текст.
Что я делал до сих пор?
Я пробовал с библиотекой распознавания речи в python
import speech_recognition as sr
import time
r=sr.Recognizer()
#This block will help in recognising audio file harvard = sr.AudioFile('voice1.wav') with harvard as source:
r.adjust_for_ambient_noise(source)
audio = r.record(source,offset=0, duration=5)
print r.recognize_google(audio, show_all=True)
Однако текст не возвращается.