Каков наилучший размер окна (в секундах) и размер прыжка (в секундах) для аудиосэмпла длиной 3 секунды? - PullRequest
0 голосов
/ 07 февраля 2019

У меня есть несколько голосовых сэмплов с размером 3s для проекта извлечения аудиофункций.Сначала я выбираю размер окна 0,5 с и 0,2 прыжка, но сомневаюсь, как выбрать лучший размер окна и размер прыжка для лучших результатов.

1 Ответ

0 голосов
/ 05 мая 2019

К сожалению, это гиперпараметры, которые необходимо оптимизировать в ваших данных.

Я часто получаю приличные результаты при длине прыжка от 10 мс до 40 мс и длине окна от 10 мс до 100 мс,в зависимости от того, хотите ли вы больше частотного или временного разрешения.

...