Я пытаюсь адаптировать монофонический распознаватель для конкретного говорящего. Я использую рецепт, приведенный в HTKBook 3.4.1 section 3.6.2
. Я застреваю на части HHEd
, которую я вызываю как sp:
HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng
Ошибка, с которой я сталкиваюсь, такова:
ERROR [+999] Components missing from Base Class list (2413 3375)<br>
ERROR [+999] BaseClass check failed
Папка classes
содержит файл global
, который имеет следующее содержимое:
~b ‘‘global’’<br>
<MMFIDMASK> *<br>
<PARAMETERS> MIXBASE<br>
<NUMCLASSES> 1<br>
<CLASS> 1 {*.state[2-4].mix[1-25]}
В файле hmmdefs
в hmm15
отсутствуют некоторые компоненты смеси (я использую 25 компонентов смеси на состояние каждого телефона). Я попытался «заполнить пробелы», указав компоненты смеси со случайными средними и значениями дисперсии, но с нулевыми весами. Это тоже не имело никакого эффекта.
hmms - это левый-правый hmms с 5 состояниями (3 излучающими), каждое из которых моделируется смесью из 25 компонентов. Каждый компонент в свою очередь моделируется MFCC с компонентами EDA. Всего 46 телефонов.
Мои вопросы:
1. Правильно ли я вызываю HHEd
? Может ли он вызываться описанным выше образом для монофонов?
2. Я знаю, что список базовых классов (rtree.base
должен содержать каждый отдельный компонент смеси, но где я могу найти эти недостающие компоненты смеси?
ПРИМЕЧАНИЕ. Пожалуйста, дайте мне знать, если потребуется дополнительная информация.
Редактировать 1: файл regtree.hed содержит следующее:
RN "models"
LS "stats_engOnly_3_4"
RC 32 "rtree"
Спасибо
Sriram