Я скачал набор данных hmdb51 для распознавания действий с разделением. Однако вместо 51 я использую только 3 классификации или категории распознавания. Моя общая идея - сбалансировать набор данных и затем использовать этот генератор для непосредственного считывания видеоизображений из названий папок, чтобы избежать всей работы по маркировке. Я понял, что для балансировки набора данных общее количество кадров, составляющих все видео в каждой категории во всех трех категориях, должно быть одинаковым, как если бы вы имели дело с набором данных изображений. Поскольку в каждой из категорий есть несколько видео различной длины, мне бы пришлось создавать видео одинаковой длины (одинаковые кадры в секунду) и иметь одинаковое количество видео в каждой категории. Для этого мне нужно:
1) увеличить количество кадров в каждом видео, добавив пустые или некоторые другие соответствующие кадры
2) разбить видео большей длины на меньшие и сбалансировать все это
3) Найдите некоторую технику, например, добавление class_weights к набору данных, если это возможно, точно так же, как к набору данных изображений
Вопросы: 1) Первый вариант, который я не считаю жизнеспособным, как добавление еще постоянные кадры могут заставить модель учиться неправильным функциям и в конечном итоге вызывать проблемы. Прав ли я в этом случае? Есть ли еще методика, позволяющая эффективно реализовать эту опцию?
2) Для второй опции я считаю, что это единственно возможный вариант. Есть ли сценарий / репозиторий или что-то подобное, которое легко доступно, потому что я хотел бы потратить меньше времени на балансировку и изменение моего набора данных.
3) Для третьего варианта есть ли способ установки class_weights?
4) Есть ли какой-то другой более быстрый и эффективный метод балансировки набора видеоданных, о котором я не знаю?