рассчитать MSE для учебного набора, в котором отсутствует переменная ответа - PullRequest
0 голосов
/ 24 октября 2018

У меня есть тренировочный набор с переменной ответа ViolentCrimesPerPop, и я намеренно подгоняю большое дерево регрессии с контролем

control1 <- rpart.control(minsplit=2, cp=1e-8, xval=20)

train_control <- rpart(ViolentCrimesPerPop ~ ., data=train, method='anova', control=control1)

, затем яиспользуйте его для прогнозирования тестового набора

predict1 <- predict(train_control, newdata=test)

, однако я не уверен, как рассчитать среднеквадратичную ошибку тестового набора, поскольку для него требуется переменная ответа ViolentCrimesPerPop, которая не являетсядано в тестовом наборе.Может кто-нибудь дать мне подсказку о том, как подойти к этой проблеме?

Ответы [ 3 ]

0 голосов
/ 24 октября 2018

Вы работаете над некоторыми тестами Kaggle, которые не предоставляют переменную ответа для набора тестов?

В любом случае, попробуйте разделить ваш тренировочный набор на новые подмножества, и использовать часть в качестве обучения, а остальные -проверь свою модельВы не можете оценить производительность модели без переменной отклика.

0 голосов
/ 30 октября 2018

Вы можете найти MSE, только зная основную правду.Если вы не знаете меток теста, то единственный способ - обучить вашу модель 70 или 80% данных поезда и проверить MSE на других 20/30% данных поезда.

0 голосов
/ 24 октября 2018

Вы не сможете рассчитать MSE для тестового набора, если не знаете основную правду (переменная ответа).Однако, возможно, вас попросили разделить набор данных, содержащий основную правду, на тренировку и тестирование;в этом случае вы можете легко вычислить MSE.

...