AWS Транскрибировать неправильно распознает медиа формат моего файла - PullRequest
0 голосов
/ 16 января 2020

Я использую лямбда-функцию для получения байтового массива аудиоданных, сохранения их в формате mp3, сохранения в S3, а затем использования объекта S3 для запуска задания транскрибирования.

Все было обработано правильно. Я вижу файл .mp3 в S3. Я также загрузил его на свой локальный компьютер и воспроизвел, и он воспроизводится правильно в формате mp3.

Однако, когда я запускаю задание на транскрипцию, я получаю сообщение об ошибке: указанный вами формат мультимедиа не соответствовать обнаруженному формату мультимедиа. Проверьте формат мультимедиа и повторите запрос.

Это мой призыв начать работу AWS Transcribe:

transcribe.start_transcription_job(
    TranscriptionJobName=job_name,
    Media={'MediaFileUri': job_uri},
    MediaFormat='mp3',
    LanguageCode='en-US'
)

Есть идеи, что может быть причиной этого?

Ура!

1 Ответ

0 голосов
/ 13 апреля 2020

mp3 требует сжатия, если вы просто сохраняете байтовый массив, то он не в формате .mp3. Вы можете использовать soxi для проверки аудио файлов: http://sox.sourceforge.net/soxi.html

...