статистика по нескольким столбцам данных в R - PullRequest
1 голос
/ 07 мая 2020

Я собираюсь найти среднее, медианное и ... моих данных. Однако мне нужно найти эти данные, например, каждые 10 столбцов, в которых есть некоторые данные NA в моих столбцах. Подскажите, пожалуйста, как мне это сделать.
Возможно, это основной c вопрос, но я не смог найти никаких сообщений по этому поводу.

Спасибо

1 Ответ

0 голосов
/ 07 мая 2020

Мы можем split набор данных в list из data.frame

library(matrixStats)
lst1 <- split.default(df1, as.integer(gl(ncol(df1), 10, ncol(df1))))

Если нам нужны отдельные mean/median

sapply(lst1, function(x) mean(unlist(x), na.rm = TRUE))
sapply(lst1, function(x) median(unlist(x), na.rm = TRUE))

данные

set.seed(24)
df1 <- as.data.frame(matrix(sample(c(NA, 1:10), 25* 10, 
          replace = TRUE), ncol = 25))
...