Q1: Предположим, что есть одна особенность в данных, которая препятствует генерализации дерева решений, поскольку связь, которую оно имеет с целевой переменной, не обобщается на тестовый набор. К счастью, есть и несколько других функций, многие из которых являются более сильными предикторами и поэтому занимают верхнюю позицию в дереве, когда древовидный алгоритм выполняется на обучающей выборке. Таким образом, повреждающая особенность проявляется только рядом с листьями большого дерева, если вообще проявляется. При применении мешков и случайных лесов к этому набору данных эта функция…
- Наносит больше урона в мешках, чем в случайных лесах
- Наносит больше повреждений в случайных лесах, чем в мешках
- Не будет иметь повреждающего воздействия после усреднения модели
- Наносит одинаковый урон при использовании этих двух методов
Q2: Невозможно рассчитать важность перестановочной переменной для алгоритмов повышения, но может применяться к мешкам и случайным лесам
Кто-нибудь знает правильные ответы на эти вопросы?