У меня есть небольшой набор акустических c наборов звуков человека, который я хотел бы дополнить, а затем передать в двоичный классификатор.
Я знаком с дополнением данных для изображений, но как это сделать для acousti c наборы данных?
Я нашел 2 связанных ответа относительно автоэнкодеров и SpecAugment с Pytorch & TorchAudio , но я хотел бы услышать ваши мысли об аудио -specifi c «лучший метод».