Question

На этой странице (https://pytorch.org/docs/stable/torchvision/models.html),) говорится, что «Все предварительно обученные модели ожидают, что входные изображения нормализуются одинаковым образом, то есть мини-партии 3-канальных RGB-изображений формы (3 x В x Ш)где H и W должны быть не менее 224. Изображения должны быть загружены в диапазон [0, 1], а затем нормализованы с использованием mean = [0.485, 0.456, 0.406] и std = [0.229, 0.224, 0.225] ".

Shouldn 't обычные mean и std нормализации будут [0.5, 0.5, 0.5] и [0.5, 0.5, 0.5]? Почему он устанавливает такие странные значения?

Zhiha · Answer 1 · 29 сентября 2019

Использование среднего и стандартного Imagenet является обычной практикой.Они рассчитаны на основе миллионов изображений.Если вы хотите тренироваться с нуля на своем собственном наборе данных, вы можете рассчитать новое среднее значение и стандартное отклонение.В противном случае рекомендуется использовать предварительно обработанную модель Imagenet с собственным средним и стандартным значением.

Почему Pytorch официально использует среднее значение = [0,485, 0,456, 0,406] и стандартное отклонение = [0,229, 0,224, 0,225] для нормализации изображений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему Pytorch официально использует среднее значение = [0,485, 0,456, 0,406] и стандартное отклонение = [0,229, 0,224, 0,225] для нормализации изображений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы