Я исследую некоторую информацию о классификации аудио, более конкретно: сбалансированные и несбалансированные наборы аудиоданных. Итак, если предположить, что здесь у меня есть две папки двух классов наборов данных: звуки автомобилей и звуки мотоциклов, папка классов автомобилей имеет 1000 .wav, а папка мотоциклов - 1000 .wav. Означает ли это, что у меня есть сбалансированные наборы данных только потому, что числа равны? Что, если общий размер WAV-файлов в классе автомобиля составляет 500 МБ, а другой - 200 МБ? Хорошо, если они оба имеют одинаковый размер папки, но что, если продолжительность отдельных аудиоклипов автомобильных записей больше, чем у других в классе мотоциклов?