Я работаю над заданием «Речь в текст». У меня есть пример работы с примером аудиофайла, но когда я пробую свой собственный аудиофайл, я получаю эту ошибку:
Traceback (most recent call last):
File "<ipython-input-27-43c56c192b14>", line 1, in <module>
with input_audio as source:
File "C:\Users\AppData\Local\Continuum\anaconda3\lib\site-packages\speech_recognition\__init__.py", line 236, in __enter__
raise ValueError("Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format")
ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format
Мой вопрос: Что я могу сделать, чтобы проанализировать мой аудиофайл? Так как похоже, что он в правильном формате ..
Я погуглил и нашел еще один вопрос по Stackoverflow . Автор упоминал, что, вероятно, тип файла WAV неправильный. Однако, когда я проверяю тип моего аудио, оно выглядит правильно:
import fleep
with open("my_own_audio.wav", "rb") as file:
info = fleep.get(file.read(128))
print(info.extension)
['wav']
Мой код (пока он такой же, как Окончательное руководство по распознаванию речи )
import os
import speech_recognition as sr
os.chdir(r'C:\Desktop\Speech_to_Text')
r = sr.Recognizer()
input_audio = sr.AudioFile('harvard.wav') # The example works!
input_audio = sr.AudioFile('my_own_audio.wav') # Will throw the error!
type(input_audio) # For both, it will print Out[29]: speech_recognition.AudioFile
# This chunk will throw the error!
with input_audio as source:
# If the data has a lot of noise.
r.adjust_for_ambient_noise(source)
audio = r.record(source)
r.recognize_google(audio, show_all = True)