Нежелательный фоновый шум в выводе SSML немецкого помощника Google - PullRequest
0 голосов
/ 25 апреля 2018

Я заметил, что есть фоновый шум, когда я выводю однозначные цифры, за которыми следует <break>. Я использую немецкий женский голос 1. У меня есть следующая разметка SSML, чтобы воспроизвести это поведение:

<speak>
   <prosody rate="medium">
      <s>
         <say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">0</say-as>
      </s>
   </prosody>
</speak>

Также я хотел бы предоставить Link в mp3 (сгенерированный с помощью симулятора TTS, немецкий, голос женский 1). Вы можете отчетливо слышать шум, особенно после цифр 0, 2, 3, 4, 6, 7. Этот эффект появляется, только если после <say-as interpret-as="cardinal">.

есть <break>.

Я бы ожидал, что при такой разметке SSML фоновый шум вообще отсутствует.

Я использую приведенную выше разметку, чтобы сообщить пользователю номер телефона, так как <say-as interpret-as="telephone">01234567890</say-as> слишком быстро записывает цифры.

1 Ответ

0 голосов
/ 10 октября 2018

Попробуйте следующее:

<speak>
   <prosody rate="medium"> 
         <s><say-as interpret-as="cardinal">0</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">1</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">2</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">3</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">4</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">5</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">6</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">7</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">8</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">9</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">0</say-as></s>
   </prosody>
</speak>
...