Я анализирую RandomForestClasifier
и мне нужна помощь.
max_features
Параметр дает максимальное количество функций для разделения в случайном лесу, которое обычно определяется как sqrt(n_features)
. Если m является квадратом из n, то ни одна из комбинаций для формирования DT не равна nCm. Что если nCm меньше n_estimators (нет деревьев решений в случайном лесу)?
пример: Для n = 7, max_features
равно 3, поэтому nCm равно 35, что означает 35 уникальных комбинаций признаков для деревьев решений. Теперь для n_estimators
= 100, будут ли остальные 65 деревьев повторять комбинацию функций? Если так, не будут ли деревья коррелировать, внося смещение в ответ?