Алгоритм коэффициентов частотного кепстра Мел - PullRequest
0 голосов
/ 26 октября 2009

Я хочу получить тембр некоторого аудио.

Для этого я сделаю алгоритм коэффициентов частотного кепстра Мел.

Реализация выглядит просто (я уже сделал шаг 1): 1. Возьмите преобразование Фурье (оконный фрагмент) сигнала. 2. Нанесите на карту мощности спектра, полученного выше, на шкалу плавления, используя треугольные перекрывающиеся окна. 3. Возьмите журналы мощностей на каждой из частот плавления. 4. Возьмите дискретное косинусное преобразование списка мощностей логарифма, как если бы это был сигнал. 5. MFCC - это амплитуды результирующего спектра.

На шаге 2 я знаю, как перейти от частоты к шкале плавления, но я не знаю, что означают эти треугольные перекрывающиеся окна ..

Как мне сделать этот шаг правильно? Что означают треугольные перекрывающиеся окна?

1 Ответ

0 голосов
/ 26 октября 2009

Как только вы выполните преобразование в шкалу плавления, примените набор перекрывающихся треугольных фильтров, равномерно распределенных по этой шкале (и, следовательно, более близко расположенных для низких частот). То есть, здесь вы переходите от грубой непрерывной кривой, возвращаемой БПФ, к набору дискретных 20-50 дискретных значений.

Я гуглил картинки фильтров и нашел несколько (оба в pdf): здесь и здесь (стр. 4). Они также подробно описывают другие детали того, как они выполняют вычисления.

...