R 'statsr rep_sample_n` - "образец с заменой" ... но когда происходит "замена"? - PullRequest
0 голосов
/ 21 февраля 2020

R пакет statsr предоставляет функцию rep_sample_n, которая описывается как:

rep_sample_n(tbl, size, replace = FALSE, reps = 1)

Значение: A tbl_df, который агрегирует все созданные образцы, с добавлением столбца replicate, который tbl_df также сгруппирован по

Так что вы можете написать что-то вроде

> trial <- rep_sample_n(cars, size = 5, reps = 15, replace = TRUE) 
> show(trial)

# A tibble: 75 x 3
# Groups:   replicate [15]
   replicate speed  dist
 *     <int> <dbl> <dbl>
 1         1    20    56
 2         1    11    17
 3         1    19    36
 4         1    15    20
 5         1    12    20
 6         2    24   120
 7         2    14    36
 8         2    20    48
 9         2    23    54
10         2    16    40
# … with 65 more rows

Но как replace работа?

replace: выборка с заменой или без нее?

Когда rep_sample_n "заменяет" наблюдения, которые будут отбираться, обратно в выборку сумка? Сразу после того, как наблюдение было случайно выведено или только после того, как было получено size наблюдений?

1 Ответ

1 голос
/ 21 февраля 2020

Эмпирически это легко проверить:

library(statsr)

df <- data.frame(ID = letters[1:3], Value = 1:3)

rep_sample_n(df, size = 4, reps = 3, replace = TRUE) 
#> # A tibble: 12 x 3
#> # Groups:   replicate [3]
#>    replicate ID    Value
#>  *     <int> <fct> <int>
#>  1         1 a         1
#>  2         1 b         2
#>  3         1 a         1
#>  4         1 c         3
#>  5         2 a         1
#>  6         2 a         1
#>  7         2 a         1
#>  8         2 c         3
#>  9         3 a         1
#> 10         3 a         1
#> 11         3 b         2
#> 12         3 a         1

Вы видите, что ответ на ваш вопрос «немедленно заменен».

Создано в 2020-02 -21 при представлении пакета (v0.3.0)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...