В настоящее время я работаю над проектом, в котором я пытаюсь создать модель машинного обучения, способную классифицировать действия в видео.Я уже создал сценарий, который может обнаружить человека в видео и генерировать данные, основанные на движениях частей тела.Это создает массив 4D со следующей формой ввода:
(nframes, nperson, nbodyparts, 3 координаты на часть тела)
Форма ввода только 1 видео (2 человека) с продолжительностьюиз 3 секунд и снятый в 60fps / s будет выглядеть следующим образом: (180, 2, 25, 3)
4D массив для каждого видео сохраняется в виде файла с фрагментами, так что если я обработаю 400 видео.Я получу 400 файлов numpy.
Следующим шагом будет создание модели RNN-LSTM keras или tenorflow, способной обучаться 400 файлам numpy и работать с массивом 4D каждого видео, ноЯ действительно не знаю, как заставить это работать.Я уже искал некоторые решения, но единственное, что я мог уловить, это то, что Keras может работать только с трехмерным массивом.
Я был бы очень признателен за вашу помощь и посмотрим, как я могу решить эту проблему, с надеждой на пример.код.
С уважением,