Что вы можете сделать, так это проанализировать полное видео, а затем получить аннотации для указанного времени или кадров, см. Этот код .
Если это не соответствует вашим требованиям, потому что видео слишком длинные, и вы хотите обработать только определенную часть c, я предлагаю вам использовать внешний инструмент, чтобы вырезать видео локально, а затем выполнить аннотацию этого фрагмента. Например, вы можете использовать следующий код, чтобы вырезать видео (есть много других).
from moviepy.video.io.ffmpeg_tools import ffmpeg_extract_subclip
ffmpeg_extract_subclip("video1.mp4", start_time, end_time, targetname="test.mp4")
И тогда вам нужно будет обработать видео из локального файла