Да, в основном, добавляя тренинги для подсказки и используя enum с vocab, часто капсулы викторины могут правильно получить голосовой ввод A, B, C, D, включая «Ace, Bee, See» (неверный результат ASR от голоса).
Я бы рекомендовал оформить капсулу QuizIt на нашем рынке. Это хороший пример сопоставления голосового ввода с выбором в представлении ввода.
Одним недостатком является количество обучения, разработчики должны обучить все возможные входные данные. Одна реализация заключается в стандартизации выбора. Рассмотрим тип капсулы для настольной игры, где игрок сталкивается с выбором, например: «Теперь вы стоите перед дверью. Что бы вы хотели сделать?» Одна из возможных реализаций состоит в том, чтобы сделать что-то вроде этого: «Вариант первый: взломать его», «Вариант два: отвернуться», «Вариант третий: попробовать только что найденный ключ» (вариант три будет представлен только в том случае, если вы получили ключ). Поэтому только обучение и сопоставление "Вариант Х".