У меня есть набор данных в качестве контролируемой задачи обучения, чтобы попробовать разные модели классификации.Цели имеют горячее кодирование, поэтому являются двоичными.Большая часть входных данных также была закодирована горячим способом.Некоторые функции находятся в диапазоне от -1 до 1. Существует одна функция, которая содержит значения от 0 до 6,25, и поэтому я считаю, что мне нужно масштабировать эту функцию.Я думаю, что обычно эта функция может быть нормализована, но вот где у меня есть вопросы:
Можно ли нормализовать только один столбец, или нормализацию нужно применять ко всему набору данных?
Если это необходимо применить ко всему набору данных, будут ли нормализующие значения со шкалой от -1 до 1 влиять на то, как данные интерпретируются моделью?
Если я не могу нормализовать данные, должен ли я их стандартизировать?