Question

Я пытаюсь преобразовать некоторые аудио-клипы на двух языках в текст. Ролики начинаются с английского, затем язык меняется на немецкий, а затем снова на английский.

Ниже мой код:

import speech_recognition as sr

r = sr.Recognizer()
audio_file = sr.AudioFile('path_to_audio')

with audio_file as source:
    audio_file_record = r.record(source)

print(r.recognize_google(audio_file_record, language='en-US'))
print(r.recognize_google(audio_file_record, language='de-DE'))

Проблема в том, что первый оператор print печатает только английскую аудио часть до немецкого языка и не печатает английский после немецкого.

Как получить полное преобразование клипа с полным текстом на обоих языках?

Я знаю, что могу установить offset и duration для достижения определенной части клипа, но тогда решение будет специфичным для клипа, который я не хочу.

Как преобразовать аудио-клипы с двумя альтернативными языками в текст, используя Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как преобразовать аудио-клипы с двумя альтернативными языками в текст, используя Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы