ваш файл имеет частоту дискретизации 8 кГц, но я думаю, что средняя частота человеческого слуха составляет примерно 20 кГц, поэтому вы уверены, что соблюдаете частоту nyquist своих выборок (файлы WAV обычно имеют частоту не менее 48 кГц)?
Частота Найквиста гласит, что если вы хотите сэмплировать данный сигнал, вы должны использовать частоту сэмплирования, которая как минимум вдвое превышает максимальную частоту данного сигнала.
Кроме того, одно и то же животное может издавать разные звуки, поэтому ваша средняя частота никогда не будет одинаковой для двух разных образцов. У вас есть порог допуска, который учитывает разные средние частоты?