Question

Я пытаюсь реализовать API преобразования речи в текст в одном из приложений моего клиента. Клиент - практикующий врач.

У меня есть предварительно записанный WAV-файл, и я могу получить расшифрованный текст для аудиофайла, отправив его содержимое в речь: распознавать API напрямую (в параметре содержимого)если длина файла меньше 1 минуты.

Для длинных аудиофайлов (длина которых превышает 1 минуту), речь: распознавать API выдает ошибку и говорит об использовании речи: Longrunningrecognize API. Ниже приводится сообщение об ошибке Json:

{
  "error": {
    "code": 400,
    "message": "Sync input too long. For audio longer than 1 min use LongRunningRecognize with a 'uri' parameter.",
    "status": "INVALID_ARGUMENT"
  }
}

Когда я читаю документацию, он говорит, что для использования речи: Longrunningrecognize API, мне нужно поместить аудиофайл в Google Storage Bucket и установить егоПубличный доступ включен, установив доступ «allUser».

Но, поскольку клиент является практикующим врачом и не хочет предоставлять публичный доступ к файлам из-за проблем с соблюдением HIPAA. Итак, ниже приведены мои вопросы:

Обязательно ли помещать файлы в Google Storage Bucket? Не могу ли я напрямую отправить содержимое длинного аудиофайла в речь: Longrunningrecognize API с параметром 'Content' вместо отправки URL-адреса GCS в параметре 'uri'?
В настоящее время я являюсьиспользуя платежную учетную запись "Trial" с бесплатным кредитом 300 $ на моем счете. Возможно ли, что после перехода из пробного в платный режим я могу отправлять длинные аудиофайлы непосредственно в речь: распознавать или речь: Longrunningrecognize API с параметром 'content'?
Если у меня естьчтобы поместить файлы в корзину Google Storage, необходимо ли включить функцию «Общий доступ»? Разве я не могу использовать URL-адрес GCS (gs: //bucket-name/audio-file-name.extension) без необходимости устанавливать его общий доступ защищенным способом?

Пожалуйста, предложите.

Brendan · Answer 1 · 11 октября 2019

Вы пытались отправить контент в речь: Longrunningrecognize? Если это не сработало, в чем было сообщение об ошибке?
Не имеет значения, что вы находитесь на пробной учетной записи.
Вы не должны устанавливать файлы для общего доступа. Чтобы речевой API работал с непубличным файлом в вашем хранилище Google Storage, вызовите речевой API, используя служебную учетную запись вместо ключа API.

Расшифровка длинных аудиофайлов в приложении iOS с помощью API google-cloud-speech

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Расшифровка длинных аудиофайлов в приложении iOS с помощью API google-cloud-speech

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы