Адаптация динамика с HTK - PullRequest
0 голосов
/ 18 июня 2011

Я пытаюсь адаптировать монофонический распознаватель для конкретного говорящего. Я использую рецепт, приведенный в HTKBook 3.4.1 section 3.6.2. Я застреваю на части HHEd, которую я вызываю как sp:

HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng

Ошибка, с которой я сталкиваюсь, такова:
ERROR [+999] Components missing from Base Class list (2413 3375)<br> ERROR [+999] BaseClass check failed

Папка classes содержит файл global, который имеет следующее содержимое:
~b ‘‘global’’<br> <MMFIDMASK> *<br> <PARAMETERS> MIXBASE<br> <NUMCLASSES> 1<br> <CLASS> 1 {*.state[2-4].mix[1-25]}

В файле hmmdefs в hmm15 отсутствуют некоторые компоненты смеси (я использую 25 компонентов смеси на состояние каждого телефона). Я попытался «заполнить пробелы», указав компоненты смеси со случайными средними и значениями дисперсии, но с нулевыми весами. Это тоже не имело никакого эффекта.

hmms - это левый-правый hmms с 5 состояниями (3 излучающими), каждое из которых моделируется смесью из 25 компонентов. Каждый компонент в свою очередь моделируется MFCC с компонентами EDA. Всего 46 телефонов.

Мои вопросы:
1. Правильно ли я вызываю HHEd? Может ли он вызываться описанным выше образом для монофонов?
2. Я знаю, что список базовых классов (rtree.base должен содержать каждый отдельный компонент смеси, но где я могу найти эти недостающие компоненты смеси?

ПРИМЕЧАНИЕ. Пожалуйста, дайте мне знать, если потребуется дополнительная информация.

Редактировать 1: файл regtree.hed содержит следующее:

RN "models"
LS "stats_engOnly_3_4"
RC 32 "rtree"

Спасибо
Sriram

1 Ответ

1 голос
/ 08 июля 2011

То, как вы вызываете HHEd, выглядит хорошоКомпоненты отсутствуют, поскольку они перестали существовать.Чтобы разобраться с несуществующими компонентами, прочитайте HTKBook-3.4.1, раздел 8.4, стр. 137.

Вопросы: - Что содержит regtree.hed?- Сколько данных (в часах) вы используете?25 смесей могут быть чрезмерными.

Возможно, вы захотите использовать более постепенное увеличение смесей - MU +1 или MU +2 и ограничить количество смесей (предположение: 3-8 в зависимости от количества тренировочных данных).

...