Важность функции Random Forest, показывающая переменную всех нулей на полпути вверх по списку - PullRequest
0 голосов
/ 18 октября 2019

Я запустил регрессор случайных лесов для некоторых данных с 10000 строками и примерно 700 переменными, используя следующий код

X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size = 0.25, random_state = 42)
model = RandomForestRegressor(n_estimators = 1000, max_depth=20)
model.fit(X_train, y_train[:,0])

Одна из моих переменных содержит все нули, и все же она отображается примерно на полпути, когда япосмотрите на упорядоченный список

model.feature_importances_

Как случайный лес может использовать столбец, который содержит нули для каждой точки данных больше, чем другие не статичные столбцы?

...