Классификационное дерево: частота ошибок тестирования и частота ошибок обучения, необрезанных равны обрезанному дереву - PullRequest
0 голосов
/ 04 января 2019

Я применил дерево классификации к набору данных, используя R, с 1070 наблюдениями и 18 переменными (-1 использовал ответ).Мой тренировочный набор 800 (случайное - начальное число 1), тестовый набор 270. Я немного удивлен результатами.Я получаю один и тот же результат для частоты ошибок при обучении, как для необрезанного, так и для обрезанного дерева.То же самое для частоты ошибок теста.Кроме того, коэффициент ошибок при обучении уступает коэффициенту ошибок при тестировании.

И при использовании перекрестной проверки у обрезанных деревьев частота ошибок была одинаковой, независимо от размера.

Являются ли мои результаты нормальными или что-то в этом роде?неправильно.Потому что я ожидал, например, ошибки теста для необрезанного дерева, превосходящего обрезанное дерево.Не равно.

Спасибо.

...