Я изо всех сил пытаюсь оценить производительность моего случайного леса - я посмотрел на среднюю относительную ошибку, но я не уверен, что это хороший показатель.Что нужно проверить?
Кроме того, как мне оптимизировать мои гиперпараметры?Я использовал rf.score(X_test,y_test)
R2, но разве это единственное, на что я должен полагаться при выполнении регрессий?Я посмотрел на результаты из сумки, но я не уверен, как их интерпретировать.
Пусть ваша оптима будет глобальной, а ваши гиперпараметры оптимизированы:)
from sklearn.ensemble import RandomForestRegressor
rf = RandomForestRegressor(n_estimators = 1000,max_depth=5,random_state = 0)
rf.fit(X_train, y_train);
predictions = rf.predict(X_test)
errors = abs((predictions - y_test)/y_test)
print('Mean Relative Error:', round(np.mean(errors), 2))