API для преобразования текста в речь Google Cloud предоставляет возможность добавлять / удалять увеличение громкости при запросе синтеза.
Ссылка: Документация
Поле, которое включите эту опцию volume_gain_db
Я использую RP C APIv1 (Google Text-to-Speech) для проекта, использующего библиотеку Go .
Код выполняется из экземпляра внутри экземпляра виртуальной машины Google Cloud.
Доступ к API (Google Text-to-Speech) включен и предоставлен для этой виртуальной машины.
Вот пример запроса:
import texttospeechpb "google.golang.org/genproto/googleapis/cloud/texttospeech/v1"
// Setting up the client..
req := texttospeechpb.SynthesizeSpeechRequest{
Input: &texttospeechpb.SynthesisInput{
InputSource: &texttospeechpb.SynthesisInput_Ssml{Ssml: "Hello this is a test"},
},
Voice: &texttospeechpb.VoiceSelectionParams{
LanguageCode: "en",
SsmlGender: texttospeechpb.SsmlVoiceGender_MALE,
},
AudioConfig: &texttospeechpb.AudioConfig{
AudioEncoding: texttospeechpb.AudioEncoding_OGG_OPUS,
VolumeGainDb: 6,
},
}
// Making the request..
В настоящее время проблема заключается в том, что установка положительного усиления, например: [0, 1, 6, 16] дБ, приводит к следующей ошибке:
Unable to get speech rpc error:
code = InvalidArgument
desc = Request contains an invalid argument.
Проверка с отрицательным значением, например: [-6, -0.1, 0] дБ работает.
Проверка с недопустимым положительным / отрицательным значением, например: 20 дБ / -100 дБ не работает должным образом.
Unable to get speech rpc error:
code = OutOfRange
desc = Out of range: valid volume_gain_db is between -96.0 and 16.0.
Я хотел бы знать, есть ли опция, которую мне нужно включить где-то, чтобы иметь положительный прирост громкости для синтеза или это ошибка в API?