Я не знаю насчет pyspeech, но если это оболочка Python вокруг речевых API Microsoft, то могут пригодиться некоторые другие посты.
Механизмы Microsoft Speech не требуют ввода с микрофона. Они могут принимать аудио файлы.
Если вы делаете транскрипцию, вам понадобится грамматика диктовки. Грамматика диктовки включена в клиентские версии речевых движков Microsoft, которые поставляются с Windows 7 и Vista. Грамматики диктовки не предоставляются на серверных движках, предоставляемых Microsoft.
Простой пример использования грамматики диктовки в C # с пространством имен System.Speech содержится в вопросе StackOverflow Проблема SAPI и Windows 7