Хотя это интересная проблема, для меня это звучит плохо. Вам нужен кадр (есть большая вероятность, что их будет больше одного, поэтому, вероятно, неправильно говорить об «одном кадре»), который отличает ваше тестовое видео от других видео, но вы не знать, что другие видео. Например, что если весь ваш набор состоит из баскетбольных видеороликов? Не зная (или, по крайней мере, не имея разумных ожиданий), каковы другие видео, эта задача невозможна даже для человека.
Один из способов, который я мог бы придумать, включает вероятностную модель, которая помогает вам определить, насколько вероятен фрейм, чтобы быть уникальным или нет. Вы можете обучить эту модель, используя некоторый существующий набор тестов видео: сравнивайте все кадры друг с другом, используя некоторую меру сходства, и сосредоточьтесь на тех, которые встречаются реже всего. Затем примените модель к другому (но похожему) тестовому набору. YMMV.
Наконец, вы упомянули, что вас интересуют категории действий, но вы фокусируете внимание на кадрах, то есть только на неподвижных изображениях. Может быть полезно сначала сегментировать видео в кадры (посмотрите на ссылку, которую вы разместили), а затем искать уникальные кадры. Затем вы можете выбрать своего уникального кандидата в кадре из уникальных снимков.
Удачи!