Я пытаюсь преобразовать некоторые аудио-клипы на двух языках в текст. Ролики начинаются с английского, затем язык меняется на немецкий, а затем снова на английский.
Ниже мой код:
import speech_recognition as sr
r = sr.Recognizer()
audio_file = sr.AudioFile('path_to_audio')
with audio_file as source:
audio_file_record = r.record(source)
print(r.recognize_google(audio_file_record, language='en-US'))
print(r.recognize_google(audio_file_record, language='de-DE'))
Проблема в том, что первый оператор print печатает только английскую аудио часть до немецкого языка и не печатает английский после немецкого.
Как получить полное преобразование клипа с полным текстом на обоих языках?
Я знаю, что могу установить offset
и duration
для достижения определенной части клипа, но тогда решение будет специфичным для клипа, который я не хочу.