Случайный лесной регрессии - Как я могу проанализировать его производительность?- питон, склеарн - PullRequest
0 голосов
/ 11 июня 2018

Я изо всех сил пытаюсь оценить производительность моего случайного леса - я посмотрел на среднюю относительную ошибку, но я не уверен, что это хороший показатель.Что нужно проверить?

Кроме того, как мне оптимизировать мои гиперпараметры?Я использовал rf.score(X_test,y_test) R2, но разве это единственное, на что я должен полагаться при выполнении регрессий?Я посмотрел на результаты из сумки, но я не уверен, как их интерпретировать.

Пусть ваша оптима будет глобальной, а ваши гиперпараметры оптимизированы:)

from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegressor(n_estimators = 1000,max_depth=5,random_state = 0)
rf.fit(X_train, y_train);

predictions = rf.predict(X_test)


errors = abs((predictions - y_test)/y_test)
print('Mean Relative Error:', round(np.mean(errors), 2)) 

1 Ответ

0 голосов
/ 11 июня 2018

Вы также можете добавить следующие две метрики:

from sklearn.metrics import accuracy_score, confusion_matrix

precision_score (my_class_column, my_forest_train_prediction) confusion_matrix (my_test_data, my_prediction_test_forest)

Также можно добавить вероятность для каждого прогноза:

my_classifier_forest.predict_proba(variable 1, variable n)
...