Определение 5 и 95 и процентилей в group_by - PullRequest
0 голосов
/ 27 марта 2020

Я ищу способ определить значения столбца в процентилях. Данные выглядят аналогично этому, но с более сложными значениями столбца E:

data.frame(Date=c(rep("2010-01-31", 60), rep("2010-02-28", 60)), E=c(rep(1:20, 6)))

Данные должны быть сгруппированы вокруг переменной данных. Скобки должны использоваться для создания гистограммы, подобной приведенной ниже. Если бы вы могли также помочь мне с кодом, который делает это, было бы здорово.

enter image description here

Ответы [ 2 ]

0 голосов
/ 27 марта 2020

Мне, вероятно, нужен оператор ifelse, подобный этому расширенному, чтобы включить все процентили.

CombData <- CombData%>% group_by (Date)%>% mutate (E_P = ifelse (E)

0 голосов
/ 27 марта 2020

Вы имеете в виду что-то в строке:

      df <- df %>%
           group_by(Date) %>% 
           mutate(first = quantile(E,0.5),
                  second = quantile(E,0.95))

С data.table:

setDT(df)
df[,c("first","second") := list(quantile(E,0.5),quantile(E,0.95)), by = "Date"]
...