Можем ли мы применить масштабирование объектов к «независимой переменной» в наборе данных? - PullRequest
0 голосов
/ 21 сентября 2018

У меня есть набор данных с 8 зависимыми переменными (2 категориальные данные).Я применил ExtraTreeClassifier() для устранения некоторых зависимых переменных.У меня также была функция масштабирования X, y.

 from sklearn.preprocessing import StandardScaler
 sc = StandardScaler()
 X = sc.fit_transform(X)
 X = sc.transform(X)
 y = sc.fit_transform(y)
 y = sc.transform(y)

И после этого я разделил набор данных как

from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_new, encoded2, 
test_size = 0.25, random_state = 0)

И теперь я применяю алгоритм DecisionTreeRegressor для прогнозирования.Но я хочу к реальному прогнозу (сейчас я получаю масштабированное значение).Как это сделать?Есть ли другой способ сделать это?Потому что я сделал так, чтобы RMSE = 0,02, а если я не зависимая от масштабирования, переменная RMSE = 18,4.Пожалуйста, предложите, как решить эту проблему.

1 Ответ

0 голосов
/ 21 сентября 2018

Ну, во-первых, масштабирование целевых переменных (y) не требуется, но если вы его масштабируете, StandardScaler и различные другие подобные методы предварительной обработки имеют функцию inverse_transform, с помощью которой вы можете получитьисходные значения.

Из документации StandardScaler:

inverse_transform(X[, copy]) Уменьшить данные до исходного представления

...