Учитывая преобразования в torchaudio, это длина окна et c. в аудио кадрах или миллисекундах - PullRequest
0 голосов
/ 20 марта 2020

Я обрабатываю аудиозаписи с помощью torchaudio. В документации перечислены win_length (int) – Window size. (Default: n_fft) Представляет ли это значение по умолчанию 400 длину окна в кадрах или миллисекундах?

1 Ответ

1 голос
/ 20 марта 2020

Переменная n_fft используется в классе Spectrogram. И это документация по функции пересылки упоминает

, где n_fft - количество ячеек Фурье

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...