Стандартные шаги установки и преобразования Scaler - PullRequest
1 голос
/ 28 февраля 2020

Я хотел бы уточнить у вас все, что касается шагов стандартного масштабирования:

ss = StandardScaler()
X_train = ss.fit_transform(X_train)
X_test = ss.transform(X_test)
X_unseen = ss.fit_transform(df_test)

df_test - это, по сути, файл .csv с полностью невидимыми данными.

Для вышеизложенного код, это нормально для ss.fit_transform (df_test), когда этот ss уже fit_transformed (X_train)? Может быть, это уже «извлечено» из набора данных X_train, и поэтому мне нужно создать новый экземпляр StandardScaler () для fit_transform (df_test)?

Спасибо.

1 Ответ

1 голос
/ 28 февраля 2020

Когда вы используете стандартный скалер, вы тренируете его только один раз, иначе он снова не будет таким же, и это повлияет на ваши следующие шаги / алгоритм. Итак, это означает:

ss = StandardScaler()
X_train = ss.fit_transform(X_train)
X_test = ss.transform(X_test)
X_unseen = ss.transform(df_test)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...