Я установил assistant-sdk-python и попробовал.Я могу получить аудио ответы.В некоторых случаях я также могу получить текстовый ответ, если я прошу время, погоду или небольшую беседу и т. Д. Но, если я спрашиваю о местоположении, я могу получить только лишний "extramental_display_text".Когда я изменяю ScreenMode на «Playing», я могу получить только ответ HTML, но любой текстовый ответ.Пожалуйста, дайте мне знать, если кто-нибудь знает решение!