Я построил систему распознавания для немецких цифр (коротких слов), используя pocketsphinx (потому что мне нужно запустить его на встроенном система ). До сих пор он распознает цифры и отклоняет ложные срабатывания с уверенностью около 80%.
Установка представляет собой ядро звездочки 13 , работающее во встроенной системе с мобильным ЦП и плагином для подключения ядра распознавания речи к клиент , который, в свою очередь, подключается к небольшому серверу , связывающемуся с pocketsphinx и связывающемуся с плагином через внутренний порт.
Я могу видеть промежуточные результаты в стандартной форме, а также окончательный вердикт с результатом признания. Модель настроена с использованием грамматики jsfg для обеспечения ложноположительного отклонения. При использовании грамматики вместо .lm вероятности не читаются, хотя, очевидно, происходит какая-то оценка, которая в конечном итоге достигает определенного порога, что, в свою очередь, заставляет PS передавать результат.
Моя проблема в том, что иногда ядру распознавания требуется более одной попытки высказывания для достижения результата, хотя мониторинг внутренних результатов ясно показывает, что правильная интерпретация уже найдена. Можно ли заставить PS передавать результаты ниже этого (возможно, мнимого) порога? Как настроить внутреннее распознавание, когда оно не использует p (x)?