На этой странице (https://pytorch.org/docs/stable/torchvision/models.html),) говорится, что «Все предварительно обученные модели ожидают, что входные изображения нормализуются одинаковым образом, то есть мини-партии 3-канальных RGB-изображений формы (3 x В x Ш)где H и W должны быть не менее 224. Изображения должны быть загружены в диапазон [0, 1], а затем нормализованы с использованием mean = [0.485, 0.456, 0.406]
и std = [0.229, 0.224, 0.225]
".
Shouldn 't обычные mean
и std
нормализации будут [0.5, 0.5, 0.5]
и [0.5, 0.5, 0.5]
? Почему он устанавливает такие странные значения?