У меня есть монофонический wav-файл для звука «разбитого стекла». Когда я графически отображаю его уровни в python с помощью библиотеки librosa, он показывает очень большой диапазон амплитуд, между + / 20000 вместо +/- 1. Когда я открываю тот же файл WAV с Audacity, уровни находятся между +/- 1 .
Мой вопрос заключается в том, что создает эту разницу в отображаемых уровнях амплитуды и как я могу исправить ее в Python? Масштабирование MinMax искажает звук, и я хочу избежать его, если это возможно.
Код:
from scipy.io import wavfile
fs1, glass_break_data = wavfile.read('test_break_glass_normalized.wav')
%matplotlib inline
import matplotlib.pyplot as plt
import librosa.display
sr=44100
x = glass_break_data.astype('float')
plt.figure(figsize=(14, 5))
librosa.display.waveplot(x, sr=sr)
Это изображения из блокнота и Audacity: