Цель : я хочу использовать предварительно обученную модель Faster-RCNN для извлечения функций из изображения.
Что я пробовал : я использую приведенный ниже код для построения модель:
import torchvision.models as models
from PIL import Image
import torchvision.transforms as T
import torch
# download the pretrained fasterrcnn model
model = models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
model.eval()
model.cuda()
# remove [2:] layers
modules = list(model.children())[:2]
model_t=torch.nn.Sequential(*modules)
# load image and extract features
img = Image.open('data/person.jpg')
transform = T.Compose([T.ToTensor()])
img_t = transform(img)
batch_t = torch.unsqueeze(img_t, 0).cuda()
ft = model_t(batch_t)
Ошибка : Но я получил следующую ошибку: TypeError: conv2d(): argument 'input' (position 1) must be Tensor, not tuple
Пожалуйста, помогите! Спасибо!