Как вы говорите, намерение вызывается голосом. Относительно простой способ сделать это будет:
Создание аудиофайла с выражением намерения с помощью инструмента polly. Например. "сыграй мою песню"
https://docs.aws.amazon.com/polly/latest/dg/API_SynthesizeSpeech.html
Каждый раз, когда пользователь нажимает на веб-ссылку, вызывайте намерение с помощью API PostContent. В основном притворяясь, что пользователь сказал это.
Пример вызова:
aws lex-runtime post-content --bot-name yourBot --bot-alias \"\\$LATEST\" --user-id youruserid--content-type \"audio/l16; rate=16000; channels=1\" --input-stream request.wav answer.mp3
где yourBot - это имя вашего бота, а request.wav - аудиофайл, ранее сгенерированный с помощью polly. Вы получите аудио ответ в файле answer.mp3
Недостаток - для этого нужно использовать lex / lambda, а не просто колбу ...
Надеюсь, это помогло!
Ester