Разная длина звуковых файлов с разными частотами дискретизации - PullRequest
0 голосов
/ 31 мая 2019

Я сейчас изо всех сил пытаюсь понять, что происходит.Итак, я создал звук с помощью функции audiowrite в Matlab (звук создается с использованием двух разных звуков, но я не думаю, что это имеет значение) сначала с частотой дискретизации 44100 Гц, а с другой - звуковой файл такой же, ночастота дискретизации составляет 48000 Гц.Сейчас я наблюдаю, что звук, производимый на частоте 44100 Гц, составляет ок.На 30 секунд дольше, чем другой (частота дискретизации 48000 Гц).Это похоже на сдвиг фазы, но я не уверен.Любая помощь / объяснение приветствуется.Я также сделал график амплитуды / времени для лучшего понимания:

here

(я установил ось х на 350 секунд, чтобы увидеть, где заканчивается сигнал).

РЕДАКТИРОВАТЬ: вот код для создания звукового файла:

[y1,F1] = audioread(cave_file);        %cave and forest files are mp3 files loaded earlier both have samp.freq of 48000Hz
[y2,F2] = audioread(forest_file);
samp_freq=44100;
%samp_freq=48000;                    
a = max(size(y1),size(y2));
z = [[y1;zeros(abs([a(1),0]-size(y1)))],[y2;zeros(abs([a(1),0]- size(y2)))]]
audiowrite('test_sound.wav', z,samp_freq);

1 Ответ

0 голосов
/ 31 мая 2019

Что такое формат хранения?Более конкретно, хранится ли в метаданных файла информация о частоте дискретизации и количестве каналов?который затем используется во время воспроизведения.

Если это так, то для этого поведения есть 3 возможности: 1) Метаданные частоты дискретизации файла 44,1 кГц неверны, в то время как звук был дискретизирован с правильной частотой, т. Е. 44,1 кГц.Поскольку файл с частотой 44,1 кГц воспроизводится дольше 48 кГц, который, как я предполагаю, воспроизводит правильный звук и воспроизводит его с правильной длительностью, можно сделать вывод, что метаданные частоты дискретизации 44,1 кГц намного меньше, чем 44,1 кГц.Не могли бы вы проверить метаданные?или прикрепите сюда файлы, чтобы я мог попробовать посмотреть?2) Выборка не произошла с правильной частотой, в то время как метаданные имеют частоту дискретизации 44,1 кГц.3) Неверно сохранено количество каналов.

В случае, если файлы являются необработанными PCM, вероятно, при воспроизведении файла 44,1 кГц это, вероятно, правильная частота дискретизации и / или количество каналов.

Надеюсь, это поможет

...