Я хочу иметь возможность решить следующую проблему в Java - так как это язык, на котором я наиболее опытен и мой предпочтительный выбор.
Я хочу иметь возможность создать модель звука - например, лай собаки, основанный, скажем, на 100 звуковых сэмплах разных собак, лающих ... Как только я получу этот образец, я хочу иметь возможность записать клип с микрофон и обработайте его по модели, чтобы определить вероятность того, что записанный образец достаточно близко соответствует модели, чтобы определить, был ли записанный звук собакой.
Я имел в виду следующее:
Получите Фурье-преобразования 100 собак.
Получите среднее значение FT из 100 - теперь это модель.
Запись аудиоклипа - генерация преобразования Фурье.
Вычтите звуковой клип FT из модели FT, чтобы увидеть, как они сравниваются?
Я не очень разбираюсь в аудио - поэтому, если кто-нибудь может сказать мне, если это правильный подход - какую библиотеку FFT использовать - и каков процесс создания среднего FT из 100 семплов - это было бы здорово!
Спасибо