Я обрабатываю аудиозаписи с помощью torchaudio. В документации перечислены win_length (int) – Window size. (Default: n_fft) Представляет ли это значение по умолчанию 400 длину окна в кадрах или миллисекундах?
win_length (int) – Window size. (Default: n_fft)
Переменная n_fft используется в классе Spectrogram. И это документация по функции пересылки упоминает
n_fft
Spectrogram
, где n_fft - количество ячеек Фурье