Я пытаюсь построить трехмерную (аналогичную видео) объемную модель классификации двоичных объектов и надеюсь сэкономить усилия, выполняя трансферное обучение из хорошо предварительно обученной модели. Я предпочитаю использовать тензор потока, но я открыт для использования других инфраструктур нейронных сетей.
Я нашел множество примеров кода и веб-сайтов, подробно описывающих то, что находится на официальном веб-сайте tenorflow
https://www.tensorflow.org/hub/tutorials/image_retraining
но все они относятся к предварительно подготовленным моделям классификации 2D-изображений и предоставляют слои для выделения объектов только для 2D-моделей
я нашел 3D модели на
https://tfhub.dev/s?module-type=video-classification
тем не менее, они не предоставляют слой-экстрактор объектов для работы с
так что я могу использовать только эти 3D-модели, предоставленные в концентраторе TF, для вывода логики на новом видео, но не для переобучения для моей собственной проблемы классификации двоичных 3D-объектов
Может ли кто-нибудь указать мне на трехмерную модель с предварительной подготовкой или модель классификации видео со связанным API-интерфейсом слоя извлечения признаков, чтобы можно было легко переучиваться и осуществлять обучение с помощью.