Существует ли функция, позволяющая получить список имен столбцов, используемых при обучении модели Random Forest Regressor?
RF использует все функции из вашего набора данных.Каждое дерево может содержать sqrt (num_of_features) или log2 (num_of_features) или что угодно, но эти столбцы выбираются случайным образом.Поэтому обычно RF покрывает все столбцы из вашего набора данных.
Может быть крайний случай, когда вы используете небольшое количество оценок в RF, и некоторые функции могут не учитываться.Я полагаю, что может помочь RandomForestRegressor.feature_importances_ (здесь могут быть индикаторы с нулевым или наноразмерным значением) или погрузиться в каждое дерево в RandomForestRegressor.estimators_.
Если нет, то есть функция, которая для отсутствующих столбцовприсвоит Nulls?
RF не принимает пропущенные значения.Либо вам нужно кодировать пропущенное значение как отдельный класс (и использовать его для обучения), либо XGBoost (например) - ваш выбор.