Question

Я запустил регрессор случайных лесов для некоторых данных с 10000 строками и примерно 700 переменными, используя следующий код

X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size = 0.25, random_state = 42)
model = RandomForestRegressor(n_estimators = 1000, max_depth=20)
model.fit(X_train, y_train[:,0])

Одна из моих переменных содержит все нули, и все же она отображается примерно на полпути, когда япосмотрите на упорядоченный список

model.feature_importances_

Как случайный лес может использовать столбец, который содержит нули для каждой точки данных больше, чем другие не статичные столбцы?

Важность функции Random Forest, показывающая переменную всех нулей на полпути вверх по списку

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Важность функции Random Forest, показывающая переменную всех нулей на полпути вверх по списку

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы