Я заметил, что есть фоновый шум, когда я выводю однозначные цифры, за которыми следует <break>
. Я использую немецкий женский голос 1. У меня есть следующая разметка SSML, чтобы воспроизвести это поведение:
<speak>
<prosody rate="medium">
<s>
<say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">0</say-as>
</s>
</prosody>
</speak>
Также я хотел бы предоставить Link в mp3 (сгенерированный с помощью симулятора TTS, немецкий, голос женский 1). Вы можете отчетливо слышать шум, особенно после цифр 0, 2, 3, 4, 6, 7. Этот эффект появляется, только если после <say-as interpret-as="cardinal">
.
есть
<break>
.
Я бы ожидал, что при такой разметке SSML фоновый шум вообще отсутствует.
Я использую приведенную выше разметку, чтобы сообщить пользователю номер телефона, так как <say-as interpret-as="telephone">01234567890</say-as>
слишком быстро записывает цифры.