У меня есть такой набор данных
set.seed(1)
df <- data.frame(ID = rep(1:4, each = 3),
x = c(1,2,3,2,3,4,1,2,3,3,4,5),
V1 = rnorm(12))
> df
ID x V1
1 1 1 -0.6264538
2 1 2 0.1836433
3 1 3 -0.8356286
4 2 2 1.5952808
5 2 3 0.3295078
6 2 4 -0.8204684
7 3 1 0.4874291
8 3 2 0.7383247
9 3 3 0.5757814
10 4 3 -0.3053884
11 4 4 1.5117812
12 4 5 0.3898432
, этот пример содержит 4 человека, определенных как ID
.Каждый человек имеет период наблюдения x
.Например, ID 1 наблюдается в моменты времени 1,2,3.
. В этом примере у меня есть 2 наблюдения в момент времени 1 (ID 1 и ID 3) и 3 наблюдения в момент времени 2 (ID 1, 2,3)
Теперь я хочу получить набор данных начальной загрузки (выборка с заменой), который содержит одинаковое количество наблюдений в каждый момент времени.
В этом примере набор данных может выглядеть следующим образомthis:
> df
ID x V1
1 1 1 -0.6264538
1 1 1 -0.6264538
2 1 2 0.1836433
2 1 2 0.1836433
3 1 3 -0.8356286
4 2 2 1.5952808
5 2 3 0.3295078
6 2 4 -0.8204684
6 2 4 -0.8204684
7 3 1 0.4874291
7 3 1 0.4874291
8 3 2 0.7383247
9 3 3 0.5757814
10 4 3 -0.3053884
11 4 4 1.5117812
11 4 4 1.5117812
12 4 5 0.3898432
12 4 5 0.3898432
12 4 5 0.3898432
12 4 5 0.3898432
этот набор данных теперь имеет 4 наблюдения в каждый момент времени.