Я хочу использовать автопилот twilio для проекта исходящих вызовов, но я не большой поклонник преобразования текста в речь AWS Polly (по крайней мере, по телефону).Я подумал, что простым способом решения этой проблемы было бы получить аудио в формате «текст в речь» из Google Cloud (или где-то еще), а не использовать что-то вроде этого:
{
"actions": [
{
"say": "Hello World!"
},
{
"listen": true
}
]
}
Это было бы что-то вроде этого:
{
"actions": [
{
"say": <recording link or file>
},
{
"listen": true
}
]
}
Можно ли воспроизводить аудиозаписи вместо того, чтобы twilio имел преобразование текста в речь и имел NLU-аспект автопилота?
Спасибо за любую помощь или предложения.