Это распространенное заблуждение, что вы должны точно работать без какой-либо грамматики, чтобы иметь возможность эффективно распознавать речь и решать прикладные задачи.Вместо этого практично использовать какое-то решение проблемы, которое будет работать и декодировать ваши файлы.
Если вы не уверены в домене или в языке, вы всегда можете использовать очень общую языковую модель с помощью слоговграмматика для декодирования неизвестных слов.После этого часто используют веб-запросы, чтобы превратить варианты, основанные на слогах, в слова, что позволяет системе приобретать словарный запас.Это позволит вам получить хороший результат для очень общих типов речи.
Sphinx-4 поддерживает это.