Я пытаюсь получить текст с аудио и записать в Excel или Блокнот. До сих пор я использовал приведенный ниже код для получения текста, но он вызывает исключение UnknownValueError, поскольку не может распознать.
*Code.py
filename = "Audio.wav"
r = sr.Recognizer()
with sr.AudioFile(filename) as source:
audio_data = r.record(source)
text = r.recognize_google(audio_data)
print(text)*
Update:
So, i came across the code which actual gives me data in the
form of numpy arrays. I assume those are digital signal data. I
want to know if we can convert those numpy arrays to text format
Here is the code i used:
*import sounddevice as sd
import soundfile as sf
from python_speech_features import mfcc
import numpy as np
filename = 'C:/Users/jalla/Desktop/sample1.wav'
# Extract data and sampling rate from file
data, fs = sf.read(filename, dtype='float32')
print(data)*
Output:
[[ 0.0000000e+00 -3.0517578e-05]
[-6.1035156e-05 -6.1035156e-05]
[ 0.0000000e+00 0.0000000e+00]
...
[ 0.0000000e+00 0.0000000e+00]
[ 0.0000000e+00 0.0000000e+00]
[ 0.0000000e+00 0.0000000e+00]]