Verizon SongID - Как это запрограммировано? - PullRequest
6 голосов
/ 21 мая 2010

Для тех, кто не знаком с программой Verizon SongID, это бесплатное приложение, которое можно загрузить через сеть Verizon VCast. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные некоему всезнающему алгоритмическому зверю, который жует его и отправляет вам обратно все теги ID3 (исполнитель, альбом, песня и т. Д.)

Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?

Я полагаю, что он должен взять звуковой файл (в каком формате?), Проанализировать его (как? С чем?) Для некоторых ключевых идентификаторов (что это за "обычные атрибуты волновых функций" фаза / сдвиг / амплитуда / и т.д.) и проверьте его по базе данных.

Все, что я нахожу в Интернете о том, как это работает, является чем-то общим, как то, что я напечатал выше.

С audiotag.info

Эта услуга основана на сложное распознавание звука алгоритм, объединяющий продвинутый звук технология снятия отпечатков пальцев и большой база данных песен. Когда вы загружаете аудио файл, он анализируется аудио движок. Во время анализа его аудио «отпечаток» извлекается и определяется путем сравнения его с музыкальная база данных. По завершении этот процесс распознавания, информация о песнях с их соответствием вероятности отображаются на экране.

1 Ответ

5 голосов
/ 21 мая 2010

Все эти сервисы работают, беря «отпечаток» из выбранных аудиоданных на стороне клиента, отправляя их на сервер и сравнивая их с базой данных отпечатков.

Один из разработчиков Shazam написал чрезвычайно информативный официальный документ о том, как работает технология. Это должно дать вам всю необходимую информацию.

...