Я хочу использовать библиотеку Librosa для создания спектрограмм. Я хочу использовать функцию librosa.core.stft для обработки речи. Они предлагают использовать параметр n_fft со значением 512 для моего случая.
Что я хочу знать, это то, какое значение я должен использовать для других параметров для достижения наилучших результатов? Я имею в виду параметры, такие как hop_length и window_length?