C # Распознавание речи - PullRequest
7 голосов
/ 25 мая 2010

Я сейчас создаю систему управления умным домом, и у меня небольшая проблема. Я думал об использовании Cosmos для базовой системы и добавлении в него необходимых библиотек пространств имен, но поскольку обычное пространство имен System.Speech.Recognition слишком сильно зависит от Windows Speech API, я должен забыть об его использовании.

Итак, мой вопрос: есть ли (если возможно, бесплатная) библиотека распознавания речи и / или синтезатора речи для C #, которая имеет следующее:

  • поддержка многоязычности
  • извлечение текстового содержимого из образца речи
  • синтезирование речи с выбираемым (или написанным пользователем) речевым шаблоном (голосом)

Лучше всего подойдет библиотека общего пользования, не зависящая от Windows, и, конечно, если она тоже будет бесплатной.

Ответы [ 2 ]

2 голосов
/ 19 сентября 2011

Voxeo предлагает учетные записи разработчиков , которые можно использовать для разработки системы домашней автоматизации с поддержкой речи. Я связал его с моей собственной системой домашней автоматизации для небольшого набора команд, которые мой дом понимает, и он прекрасно работает. Вам нужно научиться использовать VoiceXML, чтобы использовать его.

SAPI работает нормально для синтеза голоса; Я использую SAPI в своей системе для голосовых подсказок в доме, таких как прогноз погоды, который появляется на динамиках утром, когда вы входите в ванную. Если Cosmos не позволяет вам включить все необходимые вам DLL, возможно, вы могли бы создать отдельный сервис, используя SAPI, а затем использовать WCF (или другой) для связи между ними ??

Для связанной проблемы понимания естественного языка в типизированной форме я разработал C # NLP Engine , который, я надеюсь, смогу сделать доступным для некоммерческого в будущем.

Извлечение текста из речи без указания какой-либо грамматики заранее - очень сложная проблема, которая может привести к ошибкам. Даже если бы вы могли это решить, у вас все равно была бы проблема с попыткой понять, что они сказали, используя НЛП. Построение грамматики, которая направляет распознаватель к типам предложений, которые вы хотите распознать (как это делает VoiceXML), вероятно, приведет к гораздо более высокой точности.

2 голосов
/ 25 мая 2010

Проверить этот проект: http://cmusphinx.sourceforge.net/

Это проект распознавания речи с открытым исходным кодом. Он может быть обучен на любом языке, который вы хотите плюс, поскольку с открытым исходным кодом вы можете изменить его в соответствии с вашими потребностями или расширить его.

...