Я попытался с помощью функции scipy.io.wavfile.read получить звуковое давление звуковой дорожки и получить, как указано в двух выходных документах: частоту дискретизации и массив данных.Пока все хорошо.
Моя проблема в том, что выходной массив (Nx2) размерен, и я не знаю, что представляют эти два измерения.Я ожидал получить (Nx1) размерный массив с общим количеством сэмплов.
Я посмотрел онлайн и ничего не нашел, и даже после преобразования аудиосигнала в моно я все равно получаю Nx2массив, так что я не думаю, что это левый и правый канал (но я могу ошибаться).
работает следующий код:
scipy.io.wavfile.read(path+"slow_jazz.wav")
дает следующий вывод:
(44100, array([[-1.37977577e-06, 8.62224842e-05],
[ 1.10934685e-04, -1.24923863e-05],
[ 3.23722816e-05, 6.47113484e-05],
...,
[ 2.37652988e-04, 1.36341288e-04],
[ 2.67631025e-04, 2.15149150e-04],
[ 2.91718607e-04, 2.33943792e-04]], dtype=float32))
Есть идеи, что происходит?