Я пытаюсь реализовать API преобразования речи в текст в одном из приложений моего клиента. Клиент - практикующий врач.
У меня есть предварительно записанный WAV-файл, и я могу получить расшифрованный текст для аудиофайла, отправив его содержимое в речь: распознавать API напрямую (в параметре содержимого)если длина файла меньше 1 минуты.
Для длинных аудиофайлов (длина которых превышает 1 минуту), речь: распознавать API выдает ошибку и говорит об использовании речи: Longrunningrecognize API. Ниже приводится сообщение об ошибке Json:
{
"error": {
"code": 400,
"message": "Sync input too long. For audio longer than 1 min use LongRunningRecognize with a 'uri' parameter.",
"status": "INVALID_ARGUMENT"
}
}
Когда я читаю документацию, он говорит, что для использования речи: Longrunningrecognize API, мне нужно поместить аудиофайл в Google Storage Bucket и установить егоПубличный доступ включен, установив доступ «allUser».
Но, поскольку клиент является практикующим врачом и не хочет предоставлять публичный доступ к файлам из-за проблем с соблюдением HIPAA. Итак, ниже приведены мои вопросы:
Обязательно ли помещать файлы в Google Storage Bucket? Не могу ли я напрямую отправить содержимое длинного аудиофайла в речь: Longrunningrecognize API с параметром 'Content' вместо отправки URL-адреса GCS в параметре 'uri'?
В настоящее время я являюсьиспользуя платежную учетную запись "Trial" с бесплатным кредитом 300 $ на моем счете. Возможно ли, что после перехода из пробного в платный режим я могу отправлять длинные аудиофайлы непосредственно в речь: распознавать или речь: Longrunningrecognize API с параметром 'content'?
Если у меня естьчтобы поместить файлы в корзину Google Storage, необходимо ли включить функцию «Общий доступ»? Разве я не могу использовать URL-адрес GCS (gs: //bucket-name/audio-file-name.extension) без необходимости устанавливать его общий доступ защищенным способом?
Пожалуйста, предложите.