pyspeech (python) - транскрибировать mp3 файлы? - PullRequest
6 голосов
/ 06 января 2011

Я бы хотел транскрибировать mp3 (речь в текст), используя pyspeech API.Хотя я не знаю, возможно ли это.

Это так?Как?

Ответы [ 2 ]

2 голосов
/ 07 января 2011

Я не знаю насчет pyspeech, но если это оболочка Python вокруг речевых API Microsoft, то могут пригодиться некоторые другие посты.

Механизмы Microsoft Speech не требуют ввода с микрофона. Они могут принимать аудио файлы.

Если вы делаете транскрипцию, вам понадобится грамматика диктовки. Грамматика диктовки включена в клиентские версии речевых движков Microsoft, которые поставляются с Windows 7 и Vista. Грамматики диктовки не предоставляются на серверных движках, предоставляемых Microsoft.

Простой пример использования грамматики диктовки в C # с пространством имен System.Speech содержится в вопросе StackOverflow Проблема SAPI и Windows 7

2 голосов
/ 06 января 2011

pyspeech выглядит просто как интерфейс Python к обычным речевым API Windows.Скорее всего, вы бы создали какой-то метод обработки воспроизведения mp3 как источника звука для этого речевого API для прослушивания.

...