Я использую модуль случайных лесов sklearn для прогнозирования значений на основе 50 различных измерений. Когда я увеличиваю количество измерений до 150, точность модели резко снижается. Я ожидал бы, что больше данных только сделает модель более точной, но больше функций, как правило, делают модель менее точной.
Я подозреваю, что разбиение может быть выполнено только по одному измерению, что означает, что объектам, которые на самом деле более важны, уделяется меньше внимания при построении деревьев. Может ли это быть причиной?