Я пытаюсь добиться аудиосегментации путем спектральной дифференциации с использованием библиотеки librosa в python3.
Документация для функции librosa.onset.onset_strength
гласит, что вычислен спектральный поток. Википедия говорит, что это обычно достигается путем сравнения двух нормализованных спектральных кадров.
Кто-нибудь знает, являются ли вычисленные кадры для спектрального потока librosa с librosa.onset.onset_strength
нормированными спектрами? Я проверил исходный код этой функции, но ничего не нашел по нормализации спектров. Есть ли способ вычислить нормализованные кадры и передать их этой функции?
Заранее спасибо!