Tlab Audio Conversion - PullRequest
       3

Tlab Audio Conversion

0 голосов
/ 13 марта 2012

Я записал свой голос в Matlab.Теперь я хочу преобразовать это аудио в строки, т.е.письменные предложения в Matlab.Есть ли способ конвертировать аудио в текст.

Ответы [ 2 ]

0 голосов
/ 25 марта 2014

Вы можете добиться некоторого ограничения пробега с помощью встроенного в Windows Speech API.Это зависит от вашей операционной системы и т. Д., И вы должны следовать аналогичным принципам из документации API: http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx

Использование сервера ActiveX MATLAB (http://www.mathworks.co.uk/help/matlab/ref/actxserver.html)

Сначала необходимо объявить речьмеханизм распознавания

RC = actxserver('SAPI.SpSharedRecoContext'); %connect to speech engine

И затем установить различные функции обратного вызова для каждого состояния распознавателя:

RC.registerevent({'Recognition' @CallbackFunction; 'Hypothesis' @CallbackFunction; 'FalseRecognition' @CallbackFunction})

Содержимое функции обратного вызова должно быть в следующих строках:

function word = CallbackFunction(varargin)
    global word
    result = varargin{length(varargin)-2};
    word = result.Phraseinfo.GetText;
end

Затем, наконец, включите распознаватель:

RC.Recognizer.State = 'SRSActive';

Вам нужно будет обратиться к документации, для которой и когда вызываются функции обратного вызова.

Вам также потребуется настроитьсловарь грамматики для получения значимых результатов. В противном случае движок будет пытаться распознать любое слово.

0 голосов
/ 13 марта 2012

Я почти уверен, что MATLAB не имеет встроенной функции преобразования текста в текст.

Быстрый поиск в Google позволил найти хотя бы один проект, интегрирующий преобразование речи в текст в MATLAB.

http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html

Некоторым другим программным обеспечением, которое может преобразовывать записанную речь в текст, являются SAPI от Microsoft (встроенный в Windows Vista и Windows 7 и доступный для загрузки для Windows XP) и Sphinx * 1011 CMU *. проект. Nuance Dragon Naturally Speaking - вариант, но он сравнительно дорогой. Для меня не очевидно, как их можно интегрировать в MATLAB.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...