HTK: понимание результатов в итоговом файле .mlf - PullRequest
0 голосов
/ 25 января 2019

Я пытаюсь понять результат файла recout.mlf, поэтому у меня есть следующие строки в этом файле:

enter image description here

Какие из 'какбыл хорошо произнесен: тот с -524.427185 или -1054.774536

1 Ответ

0 голосов
/ 25 января 2019

Акустические показатели, полученные во время декодирования, обычно очень малы. Чтобы предотвратить недополнение, вместо правдоподобия используются логарифмические вероятности: 1.5 Распознавание и декодирование Витерби .

Меньшие значения аргумента соответствуют большим отрицательным значениям логарифмов:

Natural log

Таким образом, первый «как» получил более высокий (-524,427185) акустический балл. Логарифм является монотонной функцией (чем больше аргумент, тем больше значение), поэтому вы можете напрямую сравнить правдоподобие: -524 > -1054.

Кстати, это не обязательно означает, что первое «как» было лучше выражено. Акустическая оценка зависит от многих факторов, включая топологию модели и данные, на которых модель была обучена.

...