Я использую библиотеку Soundfile (которая использует библиотеку libsndfile) для цифровой обработки звука. Имеет функцию для чтения аудио файлов, soundfile.read (). Который можно использовать так:
import soundfile as sf
input_file, sampling_rate_orig = sf.read(Path)
Выходные сэмплы аудиофайлов сопоставлены с диапазоном (-1,1), и два моих вопроса:
1) Какая шкала / нормализация применяется для получения этого отображения?
2) Почему некоторым образцам разрешено превышать этот предел?
Объяснение 2): при чтении 60 различных аудиофайлов длительностью 3 секунды и частотой дискретизации 22050 Гц из общего количества выборок 3969000 (60 * 3 * 22050) 51 выборка имела значение больше 1. То же самое происходит для отрицательного предела. Тогда 36 образцов меньше -1.
Спасибо за любую помощь