Если я могу извлечь изображения оптического потока из последовательности кадров, могу ли я объединить каждое изображение оптического потока с изображением в градациях серого?Если ответ «да», будет ли это объединенное изображение все еще иметь временную информацию?Могу ли я затем передать это изображение в CNN, поскольку оно содержит пространственную информацию?