Я хочу извлечь объекты с использованием предварительно обученной модели CNN (ResNet50, VGG и т. Д. c) и использовать функции с функцией потери CT C.
Я хочу построить ее как текст модель распознавания.
Кто-нибудь о том, как я могу этого достичь?
Я не уверен, что вы хотите точно настроить предварительно обученные модели или использовать эти модели для извлечения характеристик. Чтобы выполнить последнее, нужно заморозить веса модели petrained (есть несколько способов сделать это в PyTorch, самый простой из которых - вызвать .eval () для модели), и передать логиты из последнего слоя модели в новую выходную головку. Смотрите руководство PyTorch здесь для более подробного руководства.