Question

Я пытаюсь классифицировать входные аудиосэмплы на основе разговорного языка на основе функций MFCC. Число разговорных языков, принимаемых во внимание, равно двум.

Что я пробовал до сих пор:

n_компонентов от 32 до 512

Результат

Моя попытка не смогла точно классифицировать аудиосэмплы. Теперь мне не ясно, правильная ли идея выше и как выбрать количество компонентов, чтобы улучшить результат.

podludek · Answer 1 · 29 января 2019

Регулирование количества компонентов может быть выполнено путем наблюдения за ответственностью компонентов, это означает проверку того, сколько выборок назначено этому компоненту на основе более высокой вероятности генерации из этого распределения в качестве критериев. После увеличения n_components вы увидите то количество сэмплов, которое наиболее вероятно генерируется компонентами. Если ответственность слишком мала, это может быть признаком перенапряжения.

Не могли бы вы объяснить, как именно работает ваш классификатор?

GMM является генеративной моделью и не может напрямую использоваться в задаче классификации. Наиболее распространенная ошибка - принять во внимание, что один гауссов компонент должен соответствовать одному классу.

Как выбрать количество компонентов в модели гауссовой смеси? Я пытаюсь классифицировать входные аудиосэмплы на основе разговорного языка.

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как выбрать количество компонентов в модели гауссовой смеси? Я пытаюсь классифицировать входные аудиосэмплы на основе разговорного языка.

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы