Мне нужен 5D вход для моей сети, использующей ConvLSTM и 3D-CNN.Преобразование видео в массив видео будет содержать массив 5D (Num примеров, Num кадров, FrameWidth, FrameHeight, NoOfChannels), но я не могу создать этот массив, так как он занимает слишком много памяти.Изолированные жесты приводят к массиву размером (7756, 125, 480, 640, 3), который слишком велик даже при использовании облачного GPU, так как занимает около 800 ГБ.
Мне нужна помощь в решении этой проблемы, если не представляется возможным альтернатива моему подходу, поскольку у меня уже есть построенная модель, просто я не могу получить свои видеоданные в требуемой форме ввода