Я полагаю, что существует Python API под названием pyspeech , который является оболочкой для речевых API Microsoft.См. pyspeech (python) - Транскрибировать mp3-файлы? , чтобы найти ответы на некоторые вопросы, которые могут быть полезны.
Как правило, с речевым API Microsoft, когда люди видят «обычные команды интерфейса графического интерфейса», это означает, чтоони создали экземпляр общего распознавателя.Вам нужно создать экземпляр распознавателя inproc.Вы делаете это, создавая экземпляр SpeechRecognitionEngine () в своем приложении.См. SpeechRecognitionEngine Class .Я подозреваю, что вы создаете экземпляр общего распознавателя - SpeechRecognizer Class
Есть очень хорошая статья о Microsoft Speech, которая была опубликована несколько лет назад в http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. Это, вероятно,лучшая вступительная статья, которую я нашел до сих пор.Это немного устарело, но очень полезно.(Метод AppendResultKeyValue был удален после бета-тестирования.)
Эти два вопроса могут содержать для вас другую полезную информацию:
- В чем разница между System.Speech.Распознавание и Microsoft.Speech.Recognition?
- SAPI и Windows 7 Проблема