Поиск различных аудио файлов для одинаковых коротких образцов - PullRequest
0 голосов
/ 17 января 2012

Рассмотрим несколько (как минимум два) разных аудио-файлов, например, несколько разных миксов или ремиксов.Наивно, я бы сказал, должно быть возможно обнаружить сэмплы, особенно вокалы, которые почти равны в двух или более файлах, конечно, только тогда, если вокальные сэмплы не изменены, растянуты, переданы, слишком сильно ревербированыи т.д.

Итак, с помощью какого алгоритма или техники это можно сделать?Допустим, пользователь будет пытаться установить временные метки во всех возможных файлах, которые описывают сравниваемые окна данных, содержащие предположительно равные звуки, вокал и т. Д.

Я знаю, что прямого подхода нет, пытаясь напрямуюсравнивать wav данные любым способом полезно.Но даже если у меня есть данные в частотной области (например, из БПФ), мне придется использовать алгоритм сравнения, который смещает окна сравнения по шкале времени, поскольку я не могу предположить, что выборки, которые я хочу найти, являются синхронизацией времениповерх всех файлов.

Заранее благодарим за любые предложения.

1 Ответ

0 голосов
/ 03 февраля 2012

Привет, это возможно !!

Вы можете использовать одну технику, называемую LSH (локальное хеширование), очень надежную.

Другой способ сделать это - попытаться выполнить анализ спектрограммы в вашемаудиофайлы ...

Создать базу данных песни

1. Record your Full Song
2. Transform the sound to spectrum
3. slice your Spectrogram in chunk and get three or four high Frequencies
4. Store all the points

Соответствовать песне

1. Record one short sample.
2. Transform the sound into another spectrum 
3. slice your Spectrogram in chunk and get three or four hight Frequencies
4. Compare the collected frequencies with your database song.
5. your match is the song with have the high hit !

, которую вы видитевот как делают ..

http://translate.google.com/translate?hl=EN&sl=pt&u=http://ederwander.wordpress.com/2011/05/09/audio-fingerprint-em-python/

ederwander

...