Я использую БПФ для аудиоданных для вывода анализатора, как вы видели бы в Winamp или Windows Media Player.Однако вывод не выглядит так здорово.Я строю графики с использованием логарифмической шкалы и усредняю линейные результаты из БПФ в соответствующие логарифмические ячейки.В качестве примера я использую бункеры типа:
16k, 8k, 4k, 2k, 1k, 500,250,125,62,31,15 [Гц]
Затем я строю график величины (дБ) от частоты [Гц].График определенно «реагирует» на музыку, и я вижу реакцию ударного сэмпла или высокого голоса.Но график очень «насыщен» рядом с более низкими частотами, и в целом не очень похож на то, что вы видите в приложениях, которые имеют тенденцию быть более равномерно распределенными.Мне кажется, что приложения, которые отображают визуальный вывод, как правило, делают с данными разные вещи, чтобы они выглядели лучше.
Что я могу сделать с данными, чтобы они больше походили на типичное приложение музыкального проигрывателя?
Немного полезной информации: я уменьшу частоту до одного канала 32 кГц и задаю временное окно 35 мс.Это означает, что БПФ получает ~ 1100 баллов.Я изменяю эти значения для эксперимента (т. Е. Пробовал 16 кГц и увеличиваю / уменьшаю длину интервала), но получаю похожие результаты.