Нужно предложение в распознавании речи? - PullRequest
2 голосов
/ 04 июля 2011

Я разработал приложение, которое конвертирует из голоса в текст, используя SAPI 5.1.

Поскольку точность слишком низкая, я решил создать свою собственную грамматику, я создал свою собственную грамматику, которая распознает только числа от одногодо десяти.

Я снова потерпел неудачу в точности.Так что я углубился в файл грамматики.Я просмотрел файл Lexion, который используется для произношения.Так что мой вопрос

  1. улучшит ли файл лексикона точность?чтобы я мог использовать произношение чисел от одного до десяти в файле лексикона, а затем использовать его.

  2. Мне нужен шаблон для создания файла лексикона.

1 Ответ

0 голосов
/ 04 июля 2011

Если ваша точность распознавания речи слабая, это может быть одной из следующих причин:

  1. Недостаточно обучающих данных - обратите внимание, что при создании системы распознавания речи, зависящей от говорящего (чтопривязан только к одному говорящему) требует большого количества единиц каждого слова (от одного до десяти в вашем случае).Отдельные единицы требуются для обучения начальных моделей с последующими встроенными данными обучения, которые могут потребоваться для дальнейшего улучшения моделей.

  2. Модель распознавания речи, независимая от говорящего, потребует еще больше данных.

  3. Несоответствие между данными тестирования и обучения.Если модели были созданы с использованием бесшумных данных или данных с акцентом, может быть трудно получить хорошие результаты при тестировании с данными, которые содержат много шума или имеют другой акцент.

Но больше подробностей о системе распознавания речи, которую вы пытаетесь создать, было бы лучше.

Обновление 1: поскольку вы упоминаете в комментариях, что используете Microsoft Speech SDK, здесь приведено руководство по обучению речи SDK звукам / акцентам .Просто следуйте инструкциям, и это должно навести вас на пути.

...