Существует класс под названием DictationGrammar , который позволяет распознавать диктованную речь.
Он также поддерживает «контекст диктовки» - так что вы можете указать, что продиктованный текст должен начинаться / заканчиваться определенной фразой.
Я думаю, что это бы сработало - технически, это все еще грамматика, но, кажется, соответствует тому, что вы ищете.