Случайный лес sklearn - предсказание равных значений - PullRequest
0 голосов
/ 28 февраля 2019

Проблема цен на дома Kaggle Я пытаюсь предсказать цены с помощью RandomForestClassifier.После прогнозирования это приводит к одинаковым ценам для всех идентификаторов.У вас есть представление о проблеме?

clf = RandomForestClassifier(n_estimators=50)
clf = clf.fit(X_train,y_train)
clf.score(X_train, y_train)
X = df_test2[feature_cols]    
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
df_imp = imp.fit_transform(X)
df_test_scale = scaler.transform(df_imp)
y_pred = clf.predict(df_test_scale)
predict_prices = pd.DataFrame({"Id" : df_test2['Id'], "SalePrice":y_pred})
predict_prices

Ответы [ 2 ]

0 голосов
/ 28 февраля 2019

Изменить как показано ниже:

clf = RandomForestClassifier(n_estimators=50)
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
X_train_imp=imp.Transform(X_train)
X_train_scaled=scaler.transform(X_train_imp)
clf = clf.fit(X_train_scaled,y_train)
clf.score(X_train, y_train)
X = df_test2[feature_cols]    
df_imp = imp.fit_transform(X)
df_test_scale = scaler.transform(df_imp)
y_pred = clf.predict(df_test_scale)
predict_prices = pd.DataFrame({"Id" : df_test2['Id'], "SalePrice":y_pred})
predict_prices
0 голосов
/ 28 февраля 2019

Поскольку вы масштабировали тренировочный набор, установите тестовый набор с таким же масштабатором.

...