Нормализация / фиксация звука? - PullRequest
0 голосов
/ 05 августа 2009

Я использую аудио метод снятия отпечатков пальцев, чтобы отмечать песни в длинных записях. Например, в записи радио-шоу. Механизм дактилоскопии работает нормально, но у меня проблема с нормализацией (или понижением частоты дискретизации).

alt text

Здесь вы можете увидеть две одинаковые песни, но разные формы волны. Я знаю, что должен сделать некоторую фиксацию DC Offset и использовать несколько фильтров с высоким и низким усилением. Я уже делаю их с помощью Sox, используя highpass 1015 и lowpass 1015. И я использую wavegain, чтобы исправить громкость и DC Offset. Но в этом случае волновые формы превращаются в такие, как показано ниже:

alt text

Но даже в этом случае я не могу получить тот же отпечаток пальца. (Я не ожидаю, что% 100 такой же, но по крайней мере% 50 было бы хорошо)

Итак. Как вы думаете? Что я могу сделать, чтобы исправить записи, чтобы иметь одинаковые отпечатки пальцев? Может быть, какой-то аудио фильтр будет работать, но я не знаю, какой использовать? Вы можете мне помочь?

Кстати, вот объяснение техники снятия отпечатков пальцев.

http://wiki.musicbrainz.org/Future_Proof_Fingerprint

http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function

1 Ответ

2 голосов
/ 31 января 2010

Ваши входные осциллограммы выглядят обрезанными, поэтому никакая фильтрация не приведет к значимому «отпечатку пальца». Убедитесь, что вы собрали действительные входные выборки, которые имеют разумный динамический диапазон, но которые не обрезают.

...