Я ищу несколько советов по классификации библиотеки звуковых эффектов. У меня есть большой набор случайных звуковых эффектов (думаю, свист, треск, рычание, скрип, выстрелы и т. Д.). Я хотел бы быть в состоянии взять рычание, например, и найти следующий рык, который звучит ближе всего к оригиналу.
Учитывая звук, какой звук из моего набора звучит ближе всего к нему.
Я провел довольно много поисков и нашел два пути, которые я до сих пор исследую. Один использует echonest, хотя их поддержка «лучшего соответствия» выглядит не слишком перспективной для публичных пользователей. Другой вариант - погрузиться в БПФ и построить собственный алгоритм сопоставления. Это хороший вариант, и он будет отличным опытом обучения, но я хотел бы узнать мнение других, которые могут немного больше узнать об обработке звука; особенно короткие клипы .5 сек. - 3 сек., не полная музыка.
Спасибо!