Я использую Standardscaler для нормализации своего набора данных, то есть я превращаю каждую функцию в z-счет, вычитая среднее значение и деля на Std.
Я хотел бы использовать Standardscaler в конвейере sklearn иМне интересно, как именно преобразование применяется к X_test.То есть в приведенном ниже коде, когда я запускаю pipeline.predict(X_test)
, я понимаю, что StandardScaler
и SVC()
запускаются на X_test, но что именно Standardscaler
использует в качестве среднего значения и StD?Те из X_Train
или он вычисляет их только для X_test
?Что если, например, X_test
состоит только из 2 переменных, нормализация будет выглядеть совсем иначе, чем если бы я нормализовал X_train
и X_test
в целом, верно?
steps = [('scaler', StandardScaler()),
('model',SVC())]
pipeline = Pipeline(steps)
pipeline.fit(X_train,y_train)
y_pred = pipeline.predict(X_test)