Question

У меня есть аудиофайл, который содержит часть, которая соответствует обученному аудио классу, например буква R в речи.

Я бы установил произвольную длину, например, 20 мс.Затем я делю аудиофайл с интервалом в 20 мс, отправляю каждый в файл Предикл.py и принимаю участие, где вероятность моего класса самая высокая.Тем не менее, с помощью этого метода я мог бы быть точно в углу нужной области, он мог бы растягиваться (дольше, чем исходный файл) и т. Д.классификатор

jonnor · Answer 1 · 25 июля 2019

Стандартный подход заключается в использовании перекрытия для ваших окон. Разбейте временной ряд на окна анализа фиксированной длины (например, window_length = 10x20ms), но при вычислении следующего окна сдвиньте его вперед на долю размера окна. Этот размер обычно называют «длиной прыжка». Например, на 10% (hop_length = 1x20ms). Это означает, что новое окно на 90% перекрывается с предыдущим.

librosa.util.frame - это удобная функция для аудио. Это также можно сделать на спектрограммах.

Как перебрать аудиофайл, чтобы не пропустить часть, которая соответствует классу?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как перебрать аудиофайл, чтобы не пропустить часть, которая соответствует классу?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов