Обрезка может снизить точность обучающего набора, так как дерево не будет изучать оптимальные параметры , а также для обучающего набора. Однако, если мы не преодолеем переоснащение путем установки соответствующих параметров, мы можем закончить построением модели, которая не сможет обобщить .
Это означает, что модель выучила слишком сложную функцию , который отлично предсказывает данные поезда, но не сможет обобщить их с помощью невидимых данных. Это является более серьезной проблемой, когда у нас более низкие тренировочные наборы, поскольку сам набор может быть недостаточно репрезентативным для новых выборок, которые могут появиться в будущем.
Поэтому вам необходимо позаботиться об этих параметрах, чтобы ограничить максимальная глубина и количество листов, чтобы модель не была слишком сложной.
Возможно, вы захотите прочитать также о компромиссе смещения дисперсии .