Просто базовый совет, он может помочь вам начать,
import torchvision.models as models
alexnet = models.alexnet(pretrained=True)
При использовании alexnet вы можете начать с предварительно обученной модели, я не видел этого в вашем коде.
Если вам нужно всего 15 классов, убедитесь, что вы удалили полностью подключенный слой в самом конце и добавили новый слой с 15 выходами,
Ваш alexnet выглядит так:
AlexNet(
(features): Sequential(
(0): Conv2d(3, 64, kernel_size=(11, 11), stride=(4, 4), padding=(2, 2))
(1): ReLU(inplace)
(2): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
(3): Conv2d(64, 192, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
(4): ReLU(inplace)
(5): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
(6): Conv2d(192, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(7): ReLU(inplace)
(8): Conv2d(384, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(9): ReLU(inplace)
(10): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(11): ReLU(inplace)
(12): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
)
(avgpool): AdaptiveAvgPool2d(output_size=(6, 6))
(classifier): Sequential(
(0): Dropout(p=0.5)
(1): Linear(in_features=9216, out_features=4096, bias=True)
(2): ReLU(inplace)
(3): Dropout(p=0.5)
(4): Linear(in_features=4096, out_features=4096, bias=True)
(5): ReLU(inplace)
(6): Linear(in_features=4096, out_features=1000, bias=True)
)
)
Итак, вам нужно удалить только слой классификатора (6).
Я думаю здесь ответил, как удалить fc6.
Для классификации по нескольким меткам последний слой в модели должен использовать сигмовидную функцию для прогнозирования меток, а в процессе обучения должна использоваться функция binary_crossentropy или nn.BCELoss
.