При использовании тега просодии в SSML с Google Cloud TTS я не могу настроить атрибуты отдельных слов без создания нежелательной паузы.
Приведенный ниже код создает разрыв между «Новым» и «Видео». Было высказано предположение, что постпроцессор может удалить эти паузы, но я хотел бы знать, есть ли способ сделать это непосредственно в самом коде?
<speak>
Hello, and welcome to this<prosody pitch="+3st">New</prosody>Video Tutorial.
</speak>