Я пытаюсь обнаружить общие объекты (живые объекты) с камеры. Как кошка, собака, человек, ребенок, ребенок ... Я пытался использовать модель coreml MobileNetV2, но эта модель обнаруживает очень специфические c объекты, такие как "Немецкая овчарка", когда это собака. Хотя это, кажется, совсем не обнаруживает людей.
Как бы я go собирался получить более общие классификации для моего варианта использования?