Ответы, которые вы хотите получить, указаны в спецификации SISR , которая предоставляет механизм для добавления значения к входным путям. Переписав свой пример:
<?xml version="1.0"?>
<grammar xmlns="http://www.w3.org/2001/06/grammar" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2001/06/grammar http://www.w3.org/TR/speech-grammar/grammar.xsd" xml:lang="en" version="1.0" mode="voice" scope="dialog" tag-format="semantics/1.0-literals">
<rule id="keep">
<one-of>
<item>
<one-of>
<item>exit</item>
<item>exit the system</item>
</one-of>
<tag>exit</tag>
</item>
<item>
<one-of>
<item>another</item>
<item>another mailbox</item>
</one-of>
<tag>another</tag>
</item>
<item>
<one-of>
<item>play</item>
<item>play back</item>
</one-of>
<tag>play</tag>
</item>
</one-of>
</rule>
</grammar>
Несколько вещей, которые нужно знать:
- Я выбрал буквальный формат тега (обратите внимание на атрибут tag-format элемента грамматики). Это также можно было бы реализовать с использованием "semantics / 1.0", и содержимое тега выглядело бы так: out = "exit";
- Значения формата тегов TellMe могут отличаться, но их руководство по разработке подразумевает, что они соответствуют стандартам.
- Как только у вас все получится, не стесняйтесь создавать грамматики наполнителя (на языке SRGS, правила). Правила-заполнители будут правилами без СИ (без элементов тега) и содержат общие фразы, которые люди добавляют в ответы. Например, конечное правило, которое может быть добавлено в конце вашей грамматики:
</one-of>
<item repeat="0-1"><ruleref uri="#trailing"/></item>
</rule>
<rule id="trailing>
<one-of>
<item>please</item>
<item>thank you</item>
</one-of>
</rule>
</grammar>
Это поддержит более естественные типы ответов. Это может или не может быть важным в зависимости от вашей телефонной базы. Грамматика наполнителя может быть очень большой, но, как правило, ее можно использовать многократно. Вы также можете добавить заполнитель в начале ввода. В приложениях с богатой речью наиболее значительный выигрыш в процессе настройки заключается в обновлении грамматики, чтобы она содержала фактические фразы, сказанные вызывающим абонентом, по сравнению с тем, о чем говорил разработчик или дизайнер VUI.