Для «большого» набора данных
dfr <- data.frame(x = 1:1000, y = runif(1000))
Вы можете взять подмножества равномерно расположенных строк с помощью
dfr[!(seq_len(nrow(dfr)) %% 50),]
Или случайные подмножества с
dfr[sample(nrow(dfr), 20),]
Как упоминалось в gd047, используйте quantile
, чтобы получить квантили / процентили.