Для обеспечения хорошего представительства населения я создал пользовательские наборы проверок на основе моих данных обучения.Тем не менее, я не уверен, как я это связываю в PCR в R
. Я попытался добавить список в аргумент сегментов, где каждый индекс похож на то, что вы делаете в предопределенном python итераторе split, который выполняется, но выполняетсянавсегда.Поэтому я чувствую, что где-то допускаю ошибку
pcr(y~X,scale=FALSE,data=tdata,validation="CV",segments=test_fold)
, где тестовое сгиб - это список, содержащий набор валидации, который принадлежит индексу
Например, если данные обучения составлены из 9samples и я хочу использовать первые три в качестве первого набора проверки для son
test_fold<-c(1,1,1,2,2,2,3,3,3)
Это выполняется, но это очень медленно, где, если я делаю обычное "CV", оно запускается за минуты.Пока результаты выглядят хорошо, но у меня есть более тысячи пробежек, которые мне нужно сделать, и мне потребовался 1 час, чтобы пройти одну.Так что если кто-нибудь знает, как я могу ускорить это, я был бы благодарен.