Число, которое вы получаете, на самом деле ничего не значит, кроме того, насколько похожи спектры.Существует так много способов изменения аудиофайла и так много способов их сравнения, что невозможно дать общий ответ.Если вы точно знаете, какие изменения сделаны, вы можете сделать разумную работу.Например, если вы знаете, что единственная модификация состоит в том, что объем был изменен с постоянным коэффициентом, тогда, если вы возьмете в квадрате величину FFT и нормализуете ее (то есть измените масштаб так, чтобы пик был 1,0), тогда это будет идентично дляоригинальные и модифицированные сигналы.Вы можете вычислить сумму разностей двух величин БПФ, но это просто число, и вы не можете преобразовать его в процент любым значимым способом (что это значит, если я говорю, что два звука отличаются на 30%?)
Так что я бы отступил немного назад и решил бы проблему, которую вы на самом деле пытаетесь решить.