Извините, что сообщаю вам, что на данный момент вы не получаете доступ к необработанным записям взаимодействий с Помощником.Вы получаете только строку высказывания пользователя.Это означает, что вы не можете разработать действие, которое идентифицирует аудиоклипы, вы можете использовать только строки в них (при условии, что механизм преобразования текста в текст может их понять)
Вы также не можете открыть веб-сайт илиПриложение YouTube на основе ЛЮБОГО ввода, даже если вы используете строки.Потому что взаимодействия с помощником голосовые.Это означает, что вы не всегда можете предположить, что у пользователя есть экран или установлено приложение YouTube.Что, если взаимодействие происходит через интеллектуальный динамик с поддержкой Assistant?
Однако вы можете воспроизводить голос пользователя (или чей-либо голос) , записав его в отдельном приложении а затем использовать синтаксис SSML или Media Response помощника для их воспроизведения. Вот подробная статья о том, что я имею в виду, и ее можно реализовать.