Распознаватель речи на 7 фруктов (исходный код) GaussianHMM используется.Каждые 7 классов имеют сбалансированный набор данных, точно 15 аудио на класс.Я пытался использовать 3-5 штатов, но результаты все еще низкие.Все остальные настройки по умолчанию, это эргодический HMM.
Я понимаю, что оценка score = hmm_model.get_score(mfcc_features)
возвращает логарифмическую вероятность наблюдения, но на удивление она отрицательная, -1101.0923021
.
Вероятность составляет np.exp(-1101.0923021) ~= 0
, что, я думаю, маловероятно, поскольку я проверяю одну выборку тренировочных данных.
Например: оценка Apple HMM для apple.wav составляет -1101.0923021
.
Есть ли способы повысить балл, чтобы сделать модель более надежной?Я делаю поиск сетки по количеству компонентов / скрытого слоя?
(PS: хотя оценки невысоки, прогноз довольно неплох)