Я хочу получить тембр некоторого аудио.
Для этого я сделаю алгоритм коэффициентов частотного кепстра Мел.
Реализация выглядит просто (я уже сделал шаг 1):
1. Возьмите преобразование Фурье (оконный фрагмент) сигнала.
2. Нанесите на карту мощности спектра, полученного выше, на шкалу плавления, используя треугольные перекрывающиеся окна.
3. Возьмите журналы мощностей на каждой из частот плавления.
4. Возьмите дискретное косинусное преобразование списка мощностей логарифма, как если бы это был сигнал.
5. MFCC - это амплитуды результирующего спектра.
На шаге 2 я знаю, как перейти от частоты к шкале плавления, но я не знаю, что означают эти треугольные перекрывающиеся окна ..
Как мне сделать этот шаг правильно?
Что означают треугольные перекрывающиеся окна?