Я использую Google TTS API, использую Wav enet, и без какой-либо известной причины звук возвращается с потерянным качеством и кажется искаженным. Это ухудшение качества иногда происходит с разными текстами, длиннее и короче.
Вы можете проверить аудио здесь
Для этого использовался следующий ssml:
<speak><prosody pitch='-3st' rate='105%'>Los Angeles on 2020-02-12 and 2020-02-13</prosody></speak>
Кто-нибудь знает, почему это может происходить?