транскрипция с API сервера MS Speech Recognition - PullRequest
0 голосов
/ 23 августа 2010

Как мы все знаем, загрузка грамматики диктовки не поддерживается в серверной версии MS voice API (Microsoft.Speech).

Q1: Есть ли способ обойти это?

Q2: Одна из идей, о которых я подумал, - это построить грамматику на основе истории разговоров (например, чата), которые люди имели по определенной теме.Программное обеспечение должно выполнять транскрипцию на естественном языке, но подмножество используемого языка может быть несколько ограничено.

Есть ли у этого шансы быть достаточно точным и надежным?Или это что-то, что вы просто не должны делать с грамматикой недикации?

Спасибо

Ян

Ответы [ 2 ]

0 голосов
/ 17 сентября 2010

Я несколько лет не работал с SAPI, но мне кажется, что вам нужна не грамматика, а модель языка .Это набор вероятностей того, что одно слово следует за другим (мое, это чрезмерное упрощение ...) В любом случае, большинство речевых движков дают вам возможность создать модель языка на основе совокупности образцов текста.Чем больше текста, тем лучше будет работать.

0 голосов
/ 31 августа 2010

Я работал над проектом, который пытался симулировать диктовку с интенсивным использованием командно-контрольных грамматик.Это не сработало;неопределенность слишком велика, и вместо разумных результатов вы получаете случайные определения.

Извините.

...