Различные значения <prosody>ssml генерируют одинаковое аудио в Google Text to Speech - PullRequest
1 голос
/ 30 апреля 2019

Невозможно создать другую звуковую волну при использовании ssml при использовании голосов WaveNet.

<prosody rate="slow" pitch="-2st">Can you hear me now?</prosody>
<prosody rate="medium" pitch="1st">Can you hear me now?</prosody>
<prosody rate="high" pitch="5st">Can you hear me now?</prosody>

Использование тега выделения приводит к тем же результатам.

Мы используем Python API из Google CloudПреобразование текста в речь для запроса генерации звука.

Мне бы хотелось слышать разные интенсивности голоса в каждом семпле.

Обратите внимание, мы также пытаемся отключить ", но это не делает различий всгенерированные аудио.

https://issuetracker.google.com/issues/131618213

...