Я извлекаю log-спектрограмму Mel из набора данных GTZAN, используя Librosa в python. Мой код -
data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)
Ну, отлично работает. Но размер каждой Mel-спектрограммы различен. Большая часть журнала Mel-спектрограммы имеет размер 2586, некоторые из них имеют размер от 2590 до 2620.
Я проверил, что размер различается при приеме журнала Mel-спектрограммы. Как они различаются по размеру при записи журнала, если все аудио имеют одинаковую длину ...
Любое предложение, спасибо