Я работаю над проектом, в котором мне нужно извлечь человеческий звук из аудиофайла .wav, используя java.
Аудио .wav файл может иметь от 3 до 4 звуков, таких как собака, кошка, музыка и человек. Мне нужно будет определить человеческий звук, а затем извлечь эту часть из аудиофайла .wav.
Я использую FFT.java и Complex.java .
Теперь я написал класс AudioFileReader, который читает файл audio.wav с жесткого диска, а затем преобразовывает его в массив байтов. Затем использовал вышеупомянутые FFT.java и Complex.java для применения FFT.fft (bytesArray), который возвращает мне комплексный массив;
Теперь проблема в том, как извлечь байт-схему человеческого звука из возвращенного массива Complex ... Кто-нибудь знает, как мне этого добиться?
Изменить: Мы предполагаем, что очень простой файл audio.wav. Например, кошачий звук затем тишина, человеческий звук затем тишина, собачий звук затем тишина и т. Д. Нет смешения голосов.