Microsoft.Speech общая грамматика языка - PullRequest
2 голосов
/ 08 сентября 2011

Если мы используем встроенную в Windows 7 функцию распознавания речи, мы можем видеть, что она довольно хороша для угадывания того, что мы продиктовали.И он работает не только с ограниченным набором команд, но и с любым произносимым словом.

С другой стороны, когда я пытаюсь программировать против классов в пространстве имен Microsoft.Speech (Microsoft Speech Server Runtime 10.2 - это то,установил), мне нужно всегда определять ограниченную грамматику для использования.

Есть ли способ просто получить продиктованный аудиофайл и попытаться разобрать его в текст, не задавая пользовательскую грамматику в Microsoft.Speech?

1 Ответ

4 голосов
/ 12 сентября 2011

Насколько я понимаю, настольные операционные системы поставляются с грамматикой диктовки.Однако в средствах распознавания серверов нет грамматики диктовки, поскольку они в основном предназначались для использования в телефонии, когда пользователи дают короткие команды системе IVR.Для получения дополнительной информации этот вопрос может быть полезен - Каков наилучший вариант для преобразования речи в текст в веб-приложении asp.net?

Помните, что используются распознаватели рабочего столаодним пользователем за раз.Они могут быть обучены для улучшения распознавания для каждого пользователя.Распознаватели серверов предназначены для одновременной работы множества пользователей.Распознаватели сервера не могут быть обучены.Возможно, точная грамматика диктовки слишком сложна без обучения?(Или, возможно, Microsoft не хочет отдавать все свои лучшие технологии?)

Я также читал (но не проверял), что устройства распознавания рабочего стола поддерживают звук более высокого качества (более высокую скорость передачи данных иразмер выборки) и распознавания сервера ограничены качеством телефонной связи.Возможно, для точной транскрипции требуется более высокое качество звука.

...