Я хочу создать модель обнаружения границы сцены. Для этого входа будет длинное видео, а на выходе будут разные сегменты видео.
Я разделил длинное видео на кадры в соответствии с вырезом камеры. Теперь у меня есть векторы функций каждого снимка, и я хочу объединить несколько снимков последовательно. Это векторы функций.
(shot1, shot2, shot3, shot4, shot5, shot5, shot6, shot7, shot8, shot9, shot10)
Тогда комбинация будет как
( shot1, shot2, shot3 | shot4, shot5 | shot6 | shot7, shot8, shot9, shot10)
Я слышал о спектральной кластеризации, но не в состоянии правильно понять. Может ли кто-нибудь помочь мне, предоставив соответствующую технику, если на основе глубокого обучения, то хорошо, а любую другую технику, основанную на машинном обучении, которая последовательно комбинирует векторы признаков снимков (это не данные временного ряда, а последовательные данные), а также номер кластера. тоже неизвестно.