Question

Я работаю над проектом по анализу речи или распознаванию речи. Я хочу, чтобы записанные аудио файлы были преобразованы в текстовую форму. Я выполняю это, используя язык Python на Spyder 3.7. Мой код работает, но он читает только аудио файлы с расширением .wav. Я хочу, чтобы он читал аудиофайлы всех расширений, таких как mp3, m4a и т. Д. Ниже приведен мой код:

import speech_recognition as sr

AUDIO_FILE = ("C: \ Users \ HP \Anaconda3 \ mittalllll \ 1.wav ")

r = sr.Recognizer ()

с sr.AudioFile (AUDIO_FILE) в качестве источника:

audio=r.record(source)

try:

print("The audio file contains: " + r.recognize_google(audio))

кроме sr.UnknownValueError:

print("Google Speech Recognition could not understand audio")

кроме sr.RequestError как e:

print("Could not request results from Google Speech Recognition service{0}".format(e))

Какую библиотеку вместо speech_recognition можно использовать для анализа речи, чтобы она могла читать записанные аудиофайлы нескольких расширений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Какую библиотеку вместо speech_recognition можно использовать для анализа речи, чтобы она могла читать записанные аудиофайлы нескольких расширений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы