Моя цель - найти повторение в звуковом сигнале. Метод, который я решил попробовать, - это выборка сигнала, выполнение нескольких кадров, сохранение их в массиве, а затем автокорреляция, чтобы выяснить, насколько сигнал похож на его предыдущее «я».
Если я выберу 512 выборочных кадров и сохраню 11 кадров, мой массив структур будет иметь форму (2570, 5).
Я думал о нескольких методах автокорреляции, но я не уверен ни в одном из них. :
Могу ли я усреднить 5 значений каждой строки, а затем выполнить простую автокорреляцию для массива 1 измерения или потери будут слишком большими?
Я видел этот вопрос , и мне было интересно, могу ли я выполнить fft на stft, а также как получить массив в форме, запрошенной в реализации, добавленной к исходному вопросу