Если вы хотите воспроизводить звук сразу после того, как что-то говорите, это больше похоже на то, что вы хотите использовать ответ Media как часть того, что вы отправляете обратно.Ваш mp3-файл должен быть доступен по HTTPS-адресу, хотя этот адрес может быть любым, если устройство может его разрешить.Поскольку он будет находиться на том же сервере, на котором работает веб-крючок, и веб-крючок должен иметь общедоступный URL-адрес HTTPS, то, вероятно, аудио также будет (или может).
Если вы заинтересованы в том, чтобы знать, чтозадержка, вы, вероятно, можете рассчитать разницу между отправкой ответа и запросом устройством файла mp3.
Нет прямого способа узнать, когда помощник закончил произносить текст, но вы можете использовать трюкис ответом СМИ, чтобы получить представление в зависимости от ваших потребностей.
Обновите в зависимости от вашего варианта использования.
Если вы делаете все это как один ответ, ион вписывается в этот ответ, и ваш звук длится всего несколько секунд, тогда вы можете сделать это, используя SSML в качестве одного ответа.С этой частью все в порядке.
Если звук длиннее или вы хотите, чтобы между вашими личностями было больше взад и вперед, вы можете использовать ответ Media для воспроизведения звука (даже очень короткого пустого звука).По окончании воспроизведения звука он отправляет событие в действие, и вы можете перейти к следующему шагу в ответе ваших личностей.