Для тех, кто не знаком с программой Verizon SongID, это бесплатное приложение, которое можно загрузить через сеть Verizon VCast. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные некоему всезнающему алгоритмическому зверю, который жует его и отправляет вам обратно все теги ID3 (исполнитель, альбом, песня и т. Д.)
Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?
Я полагаю, что он должен взять звуковой файл (в каком формате?), Проанализировать его (как? С чем?) Для некоторых ключевых идентификаторов (что это за "обычные атрибуты волновых функций" фаза / сдвиг / амплитуда / и т.д.) и проверьте его по базе данных.
Все, что я нахожу в Интернете о том, как это работает, является чем-то общим, как то, что я напечатал выше.
С audiotag.info
Эта услуга основана на
сложное распознавание звука
алгоритм, объединяющий продвинутый звук
технология снятия отпечатков пальцев и большой
база данных песен. Когда вы загружаете
аудио файл, он анализируется
аудио движок. Во время анализа его
аудио «отпечаток» извлекается и
определяется путем сравнения его с
музыкальная база данных. По завершении
этот процесс распознавания, информация
о песнях с их соответствием
вероятности отображаются на экране.