Я работаю над проектом, который требует распознавания только людей в видео или прямом эфире с камеры.В настоящее время я использую API распознавания объектов tenorflow с python, и я пробовал разные предварительно обученные модели и замороженные графы вывода.Я хочу распознавать только людей и, возможно, автомобили, поэтому мне не нужна моя нейронная сеть, чтобы распознавать все 90 классов, которые идут с замороженными графами вывода, основанными на mobilenet или rcnn, так как кажется, что это замедляет процесс, и 89 из 90занятия не нужны в моем проекте.Нужно ли обучать мою собственную модель или есть способ изменить графики вывода и существующие модели?Возможно, это вопрос для некоторых из вас, но учтите, что я работал с tenorflow и машинным обучением всего один месяц.Заранее спасибо