Возможно, вы захотите проверить Microsoft Speech API (SAPI). Я использовал это в Windows XP некоторое время назад, и он поддерживает разметку XML, которая объявляет команды, которые вы хотите, чтобы система распознала. Затем ваше приложение определяет, что должно произойти, когда распознается речевая команда.
Для распознавания речи проверьте интерфейс ISpRecoContext .
Раньше это был интерфейс COM, но с Vista вы можете использовать .NET. Или, по-видимому, вы можете использовать Python , если вы предпочитаете!
Редактировать
Microsoft Speech Server 2007 поддерживает VoiceXML , упомянутый в другом ответе на этот вопрос.