Как случайным образом выбрать n наблюдений в кадре данных? - PullRequest
0 голосов
/ 18 марта 2020

при достаточно большом кадре данных я хочу произвольно выбрать 500 наблюдений

samp <- sample_n(df,500)
samp 

по какой-то причине не работает, просто выдает ошибку "Ошибка: size должно быть меньше или равно 1 (размер данных), установите replace = ИСТИНА для использования выборки с заменой "

1 Ответ

3 голосов
/ 18 марта 2020

Поскольку блок данных группируется, он пытается получить 500 наблюдений от каждой группы. ungroup датафрейм, а затем использовать sample_n.

library(dplyr)
samp <- df %>% ungroup() %>% sample_n(500)

В базе R мы можем использовать sample напрямую без разгруппировки.

samp <- df[sample(nrow(df), 500), ]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...