Да, pyKaldi поддерживает значения достоверности (показатель достоверности слова), рассчитанные с минимальным байесовским риском (MBR). Вы найдете всю необходимую информацию в документации. Вот ссылка на описание модуля:
https://pykaldi.github.io/api/kaldi.lat.html?highlight=mbr#module-kaldi.lat.sausages
Как видно из названия, это значение доверия, но оно не выражает, насколько "вероятно", чторезультирующий текстовый вывод для слова, полученного (или заданного в вероятностной настройке) из последовательности аудиоблоков, является правильным. На мой взгляд, выразительность или значимость немного размыты и зависят от качества модели и данных тренировки (шум, реверберация и т. Д.). Имеет смысл сравнивать альтернативы, говоря, что тот, у которого более высокое значение, с большей вероятностью будет правильным. Это, в свою очередь, ставит проблему о том, какое расстояние назвать существенной разницей. Одно значение достоверности ничего вам не говорит, и вы не можете сравнивать две разные модели распознавателя только на основе их значений достоверности. Microsoft называет это «Вместо этого, доверительные оценки предоставляют механизм для сравнения относительной точности нескольких вариантов распознавания для данного ввода. Это облегчает получение наиболее точного результата распознавания».