Я создал модель дерева классификации и регрессии (CART) в R с использованием пакета rpart. Моя зависимая переменная является непрерывной, поэтому я построил дерево регрессии. Я также сделал обрезку. У меня есть два основных вопроса:
- На основании этой ссылки [ rpart: Требуются ли данные для обучения ] [1] Я знаю, что мне следует разделить свои данные на наборы для обучения и тестирования. Я сделал это, но не знаю, как обрезать поддерево, основанное на нелистовом узле N, и заменить его классом большинства.
- Я ищу источник для проведения необходимых тестов на этой модели (CART). Другими словами, какие меры качества подгонки я должен использовать и как (кодирование в R) измерять точность модели CART.
Спасибо. Буду признателен, если вы дадите ссылку (-ы) в ответе, если знаете, по каждому из приведенных выше вопросов