Как перебрать аудиофайл, чтобы не пропустить часть, которая соответствует классу? - PullRequest
0 голосов
/ 13 мая 2019

У меня есть аудиофайл, который содержит часть, которая соответствует обученному аудио классу, например буква R в речи.

Я бы установил произвольную длину, например, 20 мс.Затем я делю аудиофайл с интервалом в 20 мс, отправляю каждый в файл Предикл.py и принимаю участие, где вероятность моего класса самая высокая.Тем не менее, с помощью этого метода я мог бы быть точно в углу нужной области, он мог бы растягиваться (дольше, чем исходный файл) и т. Д.классификатор

1 Ответ

0 голосов
/ 25 июля 2019

Стандартный подход заключается в использовании перекрытия для ваших окон. Разбейте временной ряд на окна анализа фиксированной длины (например, window_length = 10x20ms), но при вычислении следующего окна сдвиньте его вперед на долю размера окна. Этот размер обычно называют «длиной прыжка». Например, на 10% (hop_length = 1x20ms). Это означает, что новое окно на 90% перекрывается с предыдущим.

librosa.util.frame - это удобная функция для аудио. Это также можно сделать на спектрограммах.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...