Question

Я работаю над проектом, который требует распознавания только людей в видео или прямом эфире с камеры.В настоящее время я использую API распознавания объектов tenorflow с python, и я пробовал разные предварительно обученные модели и замороженные графы вывода.Я хочу распознавать только людей и, возможно, автомобили, поэтому мне не нужна моя нейронная сеть, чтобы распознавать все 90 классов, которые идут с замороженными графами вывода, основанными на mobilenet или rcnn, так как кажется, что это замедляет процесс, и 89 из 90занятия не нужны в моем проекте.Нужно ли обучать мою собственную модель или есть способ изменить графики вывода и существующие модели?Возможно, это вопрос для некоторых из вас, но учтите, что я работал с tenorflow и машинным обучением всего один месяц.Заранее спасибо

Derek Chow · Answer 1 · 30 мая 2018

Сжатие последнего слоя для вывода 1 или двух классов вряд ли приведет к большим ускорениям.Это потому, что большая часть вычислений находится на промежуточных уровнях.Вы можете уменьшить промежуточные слои, но это приведет к снижению точности.

Управление классами в API обнаружения объектов tenorflow

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Управление классами в API обнаружения объектов tenorflow

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы