Распознавание речи всегда неточно, вы не можете ожидать, что какой-то код будет работать 100% времени. Это может работать в 90% и потерпеть неудачу в 10%. Эти 90% должны быть достаточными для создания приложения.
Вопрос не в том, почему он терпит неудачу, а в том, как часто он терпит неудачу. Вам нужно собрать статистику по этому вопросу. Если это не удается 1 раз из 20, это ожидается. Если это не удается 10 раз из 20 попыток, это, скорее всего, проблема.
Если вы думаете, что это все еще проблема, вам нужно сделать следующее:
- Запишите звук, который вы пытаетесь распознать
- Поделитесь им на форуме CMUSphinx, чтобы разработчики могли посмотреть его.
Вы можете узнать о понятиях распознавания речи в учебнике CMUSphinx
http://cmusphinx.sourceforge.net/tutorial