Я хотел бы обучить классификатор жестов рук с помощью pytorch. Изображения набора данных выглядят так.
Я пытался использовать resnet34 и какое-то расширение данных. Я получил высокую точность на тестовом наборе, но низкую точность при попытке распознать собственный жест в реальном мире. Он отлично работает, когда фон белый, сходит с ума, когда другие объекты (мое лицо, стул, кровать и т. Д. c.) Появляются на заднем плане. Может быть, это потому, что тестовые изображения имеют чистый фон, так как я могу улучшить свой классификатор? Также я хочу добавить в свой классификатор категорию «без жестов». Как я могу это сделать? Это мои преобразования увеличения данных:
transform = torchvision.transforms.Compose([
torchvision.transforms.Grayscale(3),
torchvision.transforms.RandomHorizontalFlip(),
torchvision.transforms.RandomRotation(20),
torchvision.transforms.RandomResizedCrop(64, (0.6, 1.2)),
torchvision.transforms.ToTensor(),
torchvision.transforms.Normalize((0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5)),
])
Любые советы приветствуются. Спасибо!