Я запустил регрессор случайных лесов для некоторых данных с 10000 строками и примерно 700 переменными, используя следующий код
X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size = 0.25, random_state = 42)
model = RandomForestRegressor(n_estimators = 1000, max_depth=20)
model.fit(X_train, y_train[:,0])
Одна из моих переменных содержит все нули, и все же она отображается примерно на полпути, когда япосмотрите на упорядоченный список
model.feature_importances_
Как случайный лес может использовать столбец, который содержит нули для каждой точки данных больше, чем другие не статичные столбцы?