Как запросить синтез с положительным приростом громкости? - PullRequest
0 голосов
/ 05 февраля 2020

API для преобразования текста в речь Google Cloud предоставляет возможность добавлять / удалять увеличение громкости при запросе синтеза.

Ссылка: Документация

Поле, которое включите эту опцию volume_gain_db

Я использую RP C APIv1 (Google Text-to-Speech) для проекта, использующего библиотеку Go .

Код выполняется из экземпляра внутри экземпляра виртуальной машины Google Cloud.

Доступ к API (Google Text-to-Speech) включен и предоставлен для этой виртуальной машины.

Вот пример запроса:

import texttospeechpb "google.golang.org/genproto/googleapis/cloud/texttospeech/v1"

// Setting up the client..

req := texttospeechpb.SynthesizeSpeechRequest{
    Input: &texttospeechpb.SynthesisInput{
        InputSource: &texttospeechpb.SynthesisInput_Ssml{Ssml: "Hello this is a test"},
    },
    Voice: &texttospeechpb.VoiceSelectionParams{
        LanguageCode: "en",
        SsmlGender:   texttospeechpb.SsmlVoiceGender_MALE,
    },
    AudioConfig: &texttospeechpb.AudioConfig{
        AudioEncoding: texttospeechpb.AudioEncoding_OGG_OPUS,
        VolumeGainDb: 6,
    },
}

// Making the request..

В настоящее время проблема заключается в том, что установка положительного усиления, например: [0, 1, 6, 16] дБ, приводит к следующей ошибке:

Unable to get speech rpc error: 
code = InvalidArgument 
desc = Request contains an invalid argument.

Проверка с отрицательным значением, например: [-6, -0.1, 0] дБ работает.

Проверка с недопустимым положительным / отрицательным значением, например: 20 дБ / -100 дБ не работает должным образом.

Unable to get speech rpc error: 
code = OutOfRange 
desc = Out of range: valid volume_gain_db is between -96.0 and 16.0.

Я хотел бы знать, есть ли опция, которую мне нужно включить где-то, чтобы иметь положительный прирост громкости для синтеза или это ошибка в API?

...