Я пытаюсь создать набор данных для классификации видео.Я работаю над конкретным проектом, для которого набор данных не существует.Моя задача - классифицировать видео или сцену в видео как некоторый класс.Может ли специалист по компьютерному зрению поделиться стратегией для этой задачи?Какие будут шаги?Я чувствую, что я начну с создания набора данных изображения из видео.Это так?или, пожалуйста, уточните подробно.