Я видел, как деление на 255 много раз использовалось в качестве нормализации в онлайн-учебниках по CNN, и это делается по всему набору данных до разделения теста поезда.
У меня сложилось впечатление, что тестовый набор должен быть нормализован в соответствии со средним / стандартным / максимальным и т. Д. Тренировочного набора. Используя / 255 по всему набору данных, очевидно, мы даем учебному набору представление о тестовом наборе. Это правда?
Какой правильный подход здесь?
Это:
x_train = (x_train - x_train_mean)/x_train_std
x_test = (x_test - x_test_mean)/x_test_std
или это:
x_train = (x_train - x_train_mean)/x_train_std
x_test = (x_test - x_train_mean)/x_train_std
или это:
data/255
Спасибо
Меня попросили предоставить справочную информацию о том, что я пробовал: это кажется неугодным, я не нашел обсуждения по этому поводу.
редактировать: просто еще одна мысль.
Поскольку и поезд, и тестовый набор уже находятся в одном масштабе (т. Е. Каждый пиксель от 0 до 255), я предполагаю, что деление на 255 не имеет значения, теперь они находятся в одном масштабе, но из 0 -1.