У меня есть отличный набор данных, содержащий видео и координаты игрока / мяча gps x, y, z (относительно футбольного поля).
Моя цель - создать NN, который может просто смотреть видео и классифицировать игроков в каждой команде, а затем прогнозировать положение каждого игрока по x, y, z на поле, просматривая видео.
Есть ли какие-нибудь модули, подходящие для этой проблемы?
Одна хакерская обходная идея, которая у меня была, заключалась в том, чтобы предсказать ограничивающие прямоугольники вокруг игроков одной нейронной сетью, а с помощью другого NN предсказать координату xyz на основе размера / положения ограничивающего прямоугольника в сочетании с маркерами на поле (то есть линиями поля с известными расстояниями). Мысли об этом также?
Я бы предпочел использовать подход, который объединяет все в одну нейронную сеть, любые указатели в правильном направлении очень ценятся.