Я почти уверен, что вы можете найти ответы на указанные вопросы, прочитав документацию базы знаний GCP, в частности, о AutoML Video Intelligence продукт.
Как минимум Отслеживание объектов процесс хорошо объясняется в терминах реализации либо с пользовательским интерфейсом консоли GCP , либо с помощью HTTP-вызовов в Cloud REST AutoML API .
Кроме того, вы можете найти пример , в котором рассказывается, как обрабатывать расположение сегментов видео для соответствующих запросов прогнозирования.
Вы можете настроить начальный вопрос , добавив в него некоторые сведения о вашем сценарии использования, чтобы изысканно рассмотреть решение.