Я делаю некоторые проблемы с классификацией, и я нашел что-то "странное"
вот код, который я запускаю
set.seed(85)
split=sample.split(newauto$year,SplitRatio =1/2)
training_set = subset(newauto, split == TRUE)
test_set = subset(newauto, split == FALSE)
modelo1=lda(mpg01~origin+year*weight+displacement,data=training_set)
lda.pred1=predict(modelo1,test_set)
lda.class1=lda.pred1$class
table(lda.class1,test_set$mpg01)
errorr=mean(lda.class1==test_set$mpg01)
Что я заметил, так это то, что если я использую разные столбцы newauto ( фрейм данных), частота ошибок изменяется. Это нормально? Я предположил, что sample.split зависит только от начального числа, а не от выбранного столбца
Спасибо.