Я аннотировал примерно 15 минут видео с помощью CVAT от Intel. - https://github.com/opencv/cvat При...