Как я могу преобразовать речь в текст? - PullRequest
44 голосов
/ 29 января 2009

Как я могу взять MP3 и преобразовать речь в текст?

Я получил несколько записанных заметок с конференции и с собраний (на записи есть один голос, который является моим голосом). Я подумал, что было бы проще и интеллектуально интересно преобразовать в текст, используя инструменты речи в текст, а не просто переписать вручную. Я знаю, что есть технологии, особенно для приложений VoIP, использующих Asterisk и Podcasts, но каковы они и как их использовать?

Ответы [ 4 ]

30 голосов
/ 29 января 2009

Открытый исходный код: CMU Sphinx

Условно-бесплатная: http://www.e -speaking.com / (Windows)

Коммерческий: Dragon NaturallySpeaking (Windows)

5 голосов
/ 24 марта 2012

.NET может сделать это с помощью пространства имен System.Speech.

Сначала вам нужно будет конвертировать в .wav или записывать звук в реальном времени с микрофона.

Подробную информацию о реализации можно найти здесь: Транскрибирование аудио с помощью .NET

4 голосов
/ 29 января 2009

Dragon NaturallySpeaking поддерживает вход MP3.

Если вы хотите версию с открытым исходным кодом (я думаю, что есть несколько проектов по интеграции Asterisk, основанных на этом).

2 голосов
/ 30 ноября 2017

Поздно на вечеринку, поэтому отвечу больше для дальнейшего использования.

Достижения в данной области + мышление и повестка дня Mozilla привели к этим двум проектам в этом направлении:

Последний имеет 12 ГБ данных для скачивания. Первый позволяет обучать модель с вашими собственными аудиофайлами, насколько я понимаю

...