Я пытаюсь сократить полные данные, используя стратифицированную выборку.Я использую столбец Claim_Num.Это распределение ниже:
claimCounts <- table(full_data$Claim_Num)
claimCounts
0 1 2 10
1322244 6834 36 1
Мне нужны все строки с одним или несколькими утверждениями;но хочу сделать выборку из строк с 0 заявками.Кроме того, для каждой строки с заявкой мне нужно 10 строк без претензий.
Код, который я использую, приведен ниже:
sampleRows <- strata(full_data, "Claim_Num", round(claimCounts / c(10,1,1,1)), method="srswor")
Однако он выдает следующую ошибку:
Error in strata(full_data, "Claim_Num", round(claimCounts/c(10, 1, 1, :
not enough obervations in the stratum 2
Я не уверен, почему?Может кто-нибудь помочь.Заранее спасибо.