Расшифровка длинных аудиофайлов в приложении iOS с помощью API google-cloud-speech - PullRequest
0 голосов
/ 04 октября 2019

Я пытаюсь реализовать API преобразования речи в текст в одном из приложений моего клиента. Клиент - практикующий врач.

У меня есть предварительно записанный WAV-файл, и я могу получить расшифрованный текст для аудиофайла, отправив его содержимое в речь: распознавать API напрямую (в параметре содержимого)если длина файла меньше 1 минуты.

Для длинных аудиофайлов (длина которых превышает 1 минуту), речь: распознавать API выдает ошибку и говорит об использовании речи: Longrunningrecognize API. Ниже приводится сообщение об ошибке Json:

{
  "error": {
    "code": 400,
    "message": "Sync input too long. For audio longer than 1 min use LongRunningRecognize with a 'uri' parameter.",
    "status": "INVALID_ARGUMENT"
  }
}

Когда я читаю документацию, он говорит, что для использования речи: Longrunningrecognize API, мне нужно поместить аудиофайл в Google Storage Bucket и установить егоПубличный доступ включен, установив доступ «allUser».

Но, поскольку клиент является практикующим врачом и не хочет предоставлять публичный доступ к файлам из-за проблем с соблюдением HIPAA. Итак, ниже приведены мои вопросы:

  1. Обязательно ли помещать файлы в Google Storage Bucket? Не могу ли я напрямую отправить содержимое длинного аудиофайла в речь: Longrunningrecognize API с параметром 'Content' вместо отправки URL-адреса GCS в параметре 'uri'?

  2. В настоящее время я являюсьиспользуя платежную учетную запись "Trial" с бесплатным кредитом 300 $ на моем счете. Возможно ли, что после перехода из пробного в платный режим я могу отправлять длинные аудиофайлы непосредственно в речь: распознавать или речь: Longrunningrecognize API с параметром 'content'?

  3. Если у меня естьчтобы поместить файлы в корзину Google Storage, необходимо ли включить функцию «Общий доступ»? Разве я не могу использовать URL-адрес GCS (gs: //bucket-name/audio-file-name.extension) без необходимости устанавливать его общий доступ защищенным способом?

Пожалуйста, предложите.

1 Ответ

0 голосов
/ 11 октября 2019
  1. Вы пытались отправить контент в речь: Longrunningrecognize? Если это не сработало, в чем было сообщение об ошибке?

  2. Не имеет значения, что вы находитесь на пробной учетной записи.

  3. Вы не должны устанавливать файлы для общего доступа. Чтобы речевой API работал с непубличным файлом в вашем хранилище Google Storage, вызовите речевой API, используя служебную учетную запись вместо ключа API.

...