Повторите случайную выборку строк - PullRequest
0 голосов
/ 04 июня 2018

У меня есть кадр данных, содержащий 2 столбца: столбец 1 - это идентификаторы, а столбец 2 - это значения, связанные с каждым идентификатором (всего 59 разных строк).

Пример:

     [ID] [value] 
[1]   a   164  
[2]   b   167  
[3]   c   120  
[4]   d   117  
[5]   e   106 

Я предполагаю, что единственный способ случайной выборки из столбца 1 и сохранения связанного значения в столбце 2 - выборка строк.Мне нужно сделать выборку 50 х 1 строк, 50 х 2 строки, 50 х 3 строки, 50 х 4 строки и т. Д. До 59 строк.В идеале, с каждой выборкой выводится набор данных в виде кадра данных.Итак, я бы получил 59 наборов случайно выбранных данных.По сути, это то же самое, что и создание случайных подмножеств данных.

У меня есть этот код, который производит df из 10 случайно выбранных строк, например.

sample_df<-df[sample.int(nrow(df),size=10,replace=TRUE),]

Вопрос в том, как настроить этот код так, чтобы он выдавал 50 умноженных на 10 случайных строк?Должен ли я использовать цикл для генерации всех случайных выборок, которые мне нужны?

1 Ответ

0 голосов
/ 04 июня 2018

Вы можете сделать это с помощью lapply, который вернет список фреймов данных:

lapply(1:59, function(x) df[sample(nrow(df), size = x, replace = TRUE),])

...