Это во многом зависит от вашего определения «больше всего похоже».В зависимости от вашего варианта использования это может быть много вещей.Если вы просто хотите сравнить голые спектры всего файла, вы можете просто сопоставить значения, возвращаемые двумя БПФ.
Однако спектры, как правило, сильно меняются, когда файлы деформируются во времени.Чтобы выяснить разницу с этим, вам нужно сделать FFT с окнами и сравнить спектры для каждого окна.Затем определяется ваша разностная функция, которую вы можете использовать в Динамическом алгоритме деформации времени .
Если вам нужно подобие восприятия, БПФ, вероятно, не даст вам того, что вам нужно. MFCC записей, скорее всего, гораздо ближе к этой проблеме.Опять же, вам может потребоваться рассчитать оконные MFCC вместо MFCC для всей записи.
Если у вас снова есть музыкальные записи, вам нужны совершенно другие подходы.В блоге описывается, как работает Shazam, поэтому вы можете найти его в Google.Или, если вы хотите настоящего музыкального сходства, взгляните на эту книгу
РЕДАКТИРОВАТЬ :
Лучшим решением для указанной выше проблемы будетодин из них описал здесь («алгоритм Shazam», как упомянуто выше). Однако это немного сложнее в реализации, и более простое решение может быть достаточно хорошим.