У меня большой набор данных, с которым я пытаюсь работать.В настоящее время я пытаюсь разделить свой набор данных на три разных фрейма данных, которые будут использоваться для разных точек тестирования.
ind<-sample(3, nrow(df1), replace =TRUE, prob=c(0.40, 0.50, 0.10))
df2<-as.data.frame(df1[ind==1,1:27])
df3<-as.data.frame(df1[ind==2, 1:27])
df4<-as.data.frame(df1[ind==3,1:27])
Однако первый столбец в df1 - это номер счета, и несколько строк могутиметь тот же номер счета, так как возвращаются и ошибки включены.Я пытаюсь найти способ случайного разделения данных, но объединить все строки с одним и тем же номером счета.
Есть предложения о том, как мне это удастся сделать?