Я хочу применить преобразование для стандартизации изображений в моем наборе данных перед обучением в pytorch.Я слышал, что это значительно улучшает процесс обучения.Я думаю, что Pytorch по умолчанию делит все значения пикселей изображения на 255 перед нанесением их в тензор, это создает проблему для стандартизации ?.Онлайновое руководство рекомендует нам действовать следующим образом.
transform = transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
Однако, как показано здесь, 0,5 является лишь примером, который я нашел, а не средним значением или дисперсией для каналов моих данных.
Итак, мой вопрос: как получается среднее значение и стандартное отклонение?Нужно ли нам сглаживать и добавлять все значения зеленых пикселей входных изображений, а затем вычислять среднее и стандартное отклонение?Затем повторите для всех остальных цветов.это как это делается?
Я слышал, что был другой подход, который пытается вычислить "среднюю картинку", чтобы стандартизировать.Какая разница в результате?