Как транслировать более 1 минуты аудиоклипа в облачную речь в текстовый API? - PullRequest
0 голосов
/ 09 апреля 2019

Моя проблема в том, что я пытался транскрибировать менее одной минуты аудиоклипа с помощью Google Cloud и его работы, но когда я пробовал больше минуты, он не работает. Поэтому мой вопрос: как транслировать более минуты аудио или без ограничений?

Ответы [ 2 ]

0 голосов
/ 26 апреля 2019

Запись короткого аудиофайла с использованием синхронного распознавания речи Запись короткого аудиофайла . Если ваш аудиофайл длиннее 1 минуты, вы используете асинхронное распознавание речи.

Рассмотрим этот пример из этой документации Расшифровка длинного аудиофайла . Вы можете запустить пример команды ниже в Cloud Shell. Вам просто нужно загрузить (как загружать объекты в GCS) ваш аудиофайл в GCS, а затем использовать его в качестве ввода.

gcloud ml speech recognize-long-running \
'gs://gcs-test-data/vr.flac' \
 --language-code='en-US' --async

gcloud ml speech operations describe [OPERATION_ID]
0 голосов
/ 09 апреля 2019

С https://cloud.google.com/speech-to-text/quotas#content:

  • Для аудио длительностью более ~ 1 минуты необходимо использовать поле uri для ссылки на аудиофайл в Google Cloud Storage.

Итак, сохранитефайл в Google Storage перед расшифровкой.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...