Отличительной особенностью сервиса Google для преобразования текста в речь (как и для других, например Amazon's Polly) является то, что помимо обычного текста, который вы, похоже, используете, он принимает SSML , что означает РечьЯзык разметки синтеза. Это позволяет вам предоставлять теги XML, чтобы указать, как произносить определенные части речи. Среди них даты:
<speak>
<say-as interpret-as="date" format="yyyymmdd" detail="1">
1960-09-10
</say-as>
</speak>
(Пример взят из https://cloud.google.com/text-to-speech/docs/ssml#sayas)
Как вы наверняка знаете, вы можете проверить это прямо в браузере здесь: https://cloud.google.com/text-to-speech/.