После обмена сообщениями кажется, что ниже приведен один из способов получения желаемых значений. Сначала я определил группы, используя regional_schlüssel
. Затем я искал наименьшее значение в каждой группе. values
содержит числовые значения c, которые вы хотите обработать. Во втором summarize()
я использовал пару функций для получения значений, которые вы ищете.
library(dplyr)
library(tibble)
group_by(maindf, regional_schlüssel) %>%
summarize(values = min(year_hh_inc)) %>%
summarize(average = mean(values),
sd = sd(values),
mode = names(which.max(table(values))),
quantile25 = quantile(values)[2],
quantile75 = quantile(values)[4])
average sd mode quantile25 quantile75
<dbl> <dbl> <chr> <dbl> <dbl>
1 15035. 4292. 12271 12271 17500
Другой способ заключается в следующем. Я думаю, что использование sumamry()
делает нашу жизнь проще.
group_by(maindf, regional_schlüssel) %>%
summarize(values = min(year_hh_inc)) -> res
c(summary(res$values), sd = sd(res$values),
mode = names(which.max(table(res$values)))) %>%
enframe
name value
<chr> <chr>
1 Min. -8
2 1st Qu. 12271
3 Median 14999.5
4 Mean 15035.3142857143
5 3rd Qu. 17500
6 Max. 29999
7 sd 4291.76642645115
8 mode 12271