Влияние обрезки дерева решений на точность тестового набора и обучающего набора - PullRequest
0 голосов
/ 16 апреля 2020

Я хотел бы улучшить мое понимание того, как обрезка влияет на точность учебных и тестовых наборов.

В настоящее время я понимаю, что это повысит точность набора тестов, поскольку обрезка предотвращает переоснащение дерева. Это правильная идея?

И как обрезка повлияет на точность тренировочного набора? Я думаю, что это снижает точность, но почему?

Любая помощь приветствуется, спасибо!

1 Ответ

1 голос
/ 16 апреля 2020

Обрезка может снизить точность обучающего набора, так как дерево не будет изучать оптимальные параметры , а также для обучающего набора. Однако, если мы не преодолеем переоснащение путем установки соответствующих параметров, мы можем закончить построением модели, которая не сможет обобщить .

Это означает, что модель выучила слишком сложную функцию , который отлично предсказывает данные поезда, но не сможет обобщить их с помощью невидимых данных. Это является более серьезной проблемой, когда у нас более низкие тренировочные наборы, поскольку сам набор может быть недостаточно репрезентативным для новых выборок, которые могут появиться в будущем.

Поэтому вам необходимо позаботиться об этих параметрах, чтобы ограничить максимальная глубина и количество листов, чтобы модель не была слишком сложной.

Возможно, вы захотите прочитать также о компромиссе смещения дисперсии .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...