Я пробираюсь через превосходное Введение в статистическое обучение.В одной из лабораторий пишут
pcr.fit<-pcr(Salary~.,data=Hitters,subset=train,scale=TRUE,validation="CV")
Но это сбивает меня с толку.validation = "CV" означает, что он собирается сделать 10-кратную перекрестную проверку.У меня сложилось впечатление, что это означает, что он случайным образом разделит набор на десять наборов примерно одинакового размера, и каждый из них будет по очереди тестовым набором.Если так, то зачем мне также указывать набор тренировок?Что именно делает этот метод, когда вы указываете validation = "CV" И это подмножество = train ????
Заранее спасибо.