Question

Я пытаюсь получить текст с аудио и записать в Excel или Блокнот. До сих пор я использовал приведенный ниже код для получения текста, но он вызывает исключение UnknownValueError, поскольку не может распознать.

       *Code.py

        filename = "Audio.wav"
        r = sr.Recognizer()
        with sr.AudioFile(filename) as source:
            audio_data = r.record(source)
            text = r.recognize_google(audio_data)
            print(text)*


             Update:
             So, i came across the code which actual gives me data in the 
             form of numpy arrays. I assume those are digital signal data. I 
             want to know if we can convert those numpy arrays to text format
             Here is the code i used:

            *import sounddevice as sd
             import soundfile as sf 
            from python_speech_features import mfcc
            import numpy as np
            filename = 'C:/Users/jalla/Desktop/sample1.wav'
            # Extract data and sampling rate from file
            data, fs = sf.read(filename, dtype='float32')
            print(data)*

         Output:
        [[ 0.0000000e+00 -3.0517578e-05]
        [-6.1035156e-05 -6.1035156e-05]
        [ 0.0000000e+00  0.0000000e+00]
        ...
        [ 0.0000000e+00  0.0000000e+00]
        [ 0.0000000e+00  0.0000000e+00]
        [ 0.0000000e+00  0.0000000e+00]]

Прочитайте капчу и напишите в Excel или Блокнот

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Прочитайте капчу и напишите в Excel или Блокнот

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы