Почему после сжатия wav происходит щелчок? - PullRequest
2 голосов
/ 04 января 2012

Я использую freemp3droid для конвертации файлов WAV в MP3. В начале файла есть щелчок. Когда я смотрю на файл в Audacity, начальные 100 байтов (за пределами заголовка) имеют тот же шаблон. Что может происходить ??

Вот форма сигнала клика (он на 99% идентичен, КАЖДЫЙ раз)

enter image description here

http://code.google.com/p/freemp3fordroid/source/browse/trunk/jni/frontend/main.c#215

Ответы [ 4 ]

2 голосов
/ 04 января 2012

Ваш кодировщик пытается сжать 44-битный заголовок WAV / RIFF, как если бы он был аудио?

0 голосов
/ 08 декабря 2013

Немного поздно, но правильный ответ: freemp3droid не может и никогда не смог закодировать любой другой формат, кроме необработанного pcm.Поскольку ваш входной формат был wav, freemp3droid интерпретирует заголовок wav как сигнал и, таким образом, производит огромный начальный щелчок.

Предложение "convertFile: необработанные данные pcm или wav для преобразованияв MP3 " на http://code.google.com/p/freemp3fordroid просто неправильно.

0 голосов
/ 12 октября 2012

Стоит понять, что такое щелчок. Если вы действительно сжали заголовок, вы получите странный прерывистый сигнал для начала. Вы должны немного понять сигналы, чтобы понять, что происходит. Ваша форма волны не начинается с нулевого значения. Это означает, что вы мгновенно должны перейти от отсутствия напряжения к некоторому напряжению. Если бы у вас была синусоида, начинающаяся с нуля, вы бы услышали чистый тон. Поскольку вы начинаете с сигнала, это эквивалентно высокочастотному пику в начале, который ваши динамики превращаются в поп.

Вы получите ту же популярность, если сожмет сигнал, который не начинается с нуля.

Способ остановить это - добавить пандус для запуска звука. Начните с нуля и линейно увеличивайте, пока не достигнете начального значения своей волны, и вы не получите поп-звук.

0 голосов
/ 07 января 2012

Я не вижу здесь действительно проблемы. Потому что сжатия с потерями обычно используют функции продолжения для аппроксимации входных данных. В случае MP3 используется модифицированное косинусное дискретное преобразование, которое включает в себя несколько косинусных функций с различным набором параметров (для понимания основных понятий посмотрите ряд Фурье ) В результате вы не можете легко представить высокую частоту с такими подходами, и это вызывает высокие пики или некоторые искажения в некоторых точках.

...