Я применил дерево классификации к набору данных, используя R, с 1070 наблюдениями и 18 переменными (-1 использовал ответ).Мой тренировочный набор 800 (случайное - начальное число 1), тестовый набор 270. Я немного удивлен результатами.Я получаю один и тот же результат для частоты ошибок при обучении, как для необрезанного, так и для обрезанного дерева.То же самое для частоты ошибок теста.Кроме того, коэффициент ошибок при обучении уступает коэффициенту ошибок при тестировании.
И при использовании перекрестной проверки у обрезанных деревьев частота ошибок была одинаковой, независимо от размера.
Являются ли мои результаты нормальными или что-то в этом роде?неправильно.Потому что я ожидал, например, ошибки теста для необрезанного дерева, превосходящего обрезанное дерево.Не равно.
Спасибо.