Аудио классификация на основе БПФ - PullRequest
2 голосов
/ 07 мая 2019

В питоне я выполняю распознавание тревоги, проверяя только частоты и амплитуды. Мой код берет БПФ звука 1 с, затем сравнивает его с заданными частотами и их амплитудами. Поскольку сигналы тревоги содержат более высокие частоты (6–9 кГц и т. Д.) И длинный массив (44100 различных элементов), я мог бы добиться успеха без ML. Благодаря БПФ в высоком разрешении я могу различать изменения амплитуды даже на близких частотах, таких как 7010 Гц и 7016 Гц, и, поскольку эти частоты не имеют внешнего шума в среде записи, я могу угадать правильные сигналы тревоги. Тем не менее, я хочу реализовать это с ML, так как это трудно выполнить с большим количеством сигналов тревоги. Есть много источников классификации аудио / рабочие примеры и т. Д., Но я не мог найти тот, который лучше всего подходит для меня. Они обычно используют функцию извлечения, MFCC, но я не хочу терять свое разрешение, используя MFCC, потому что он объединяет близкие частоты. Поэтому я хочу построить алгоритм ML, который проверяет только два массива в каждом классе; частоты и амплитуды (оба имеют 44100 элементов) Можете ли вы предложить какой-либо источник для создания этого алгоритма? Я проверил источник ниже, который в порядке, но я не хочу использовать методы MFCC. Если вы прокомментируете, я могу развить свой вопрос на примерах. pyAudioClassification

...