Как расшифровать неанглийский длинный аудиофайл или видео YouTube с помощью Azure Cognition Services (речь в текст) - PullRequest
0 голосов
/ 10 октября 2019

Я хочу транскрибировать свое видео на YouTube. У меня есть бесплатная учетная запись в Azure, и я думаю, возможно ли сделать это в Azure.

  1. Для записи видео, продолжительность которого составляет около 10 минут
  2. Возможность вывода временикод транскрипции в виде обычного текста (или лучше всего в формате srt)

Я понимаю, что это автоматическая транскрипция английского языка на YouTube, но мои видео не используют поддерживаемые языки.

Обладая чрезвычайно ограниченными знаниями в области кодирования и подобных вещей в облаке, я очень старался придумать код, который работает для меня (в сеансе кода). Тем не менее, кажется, что он останавливается на 15 секунд. Я понятия не имею, как продлить время прослушивания. Подтверждено, что я пользуюсь спонсорским аккаунтом, поэтому транскрипция не ограничивается бесплатным уровнем.

import azure.cognitiveservices.speech as speechsdk

speech_key, service_region, language = "thespeechkey", "eastus", "myLanguageCoding"
speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region, speech_recognition_language=language)

audio_config = speechsdk.audio.AudioConfig(filename='123.wav')
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_config)
result = speech_recognizer.recognize_once()
print(result.text)

Как и в приведенном выше кодировании, ограничено только 15 секундами. Я бы хотел, чтобы это длилось до 10 минут с возможностью экспорта и временного кода.

Большое спасибо за помощь!

...