Как добавить итоговую статистику в гистограмму, используя ggplot2? - PullRequest
5 голосов
/ 02 апреля 2020

Я хочу добавить сводную статистику в график гистограммы, сделанный с использованием ggplot2. Я использую следующий код

#Loading the required packages
library(dplyr)
library(ggplot2)
library(reshape2)
library(moments)
library(ggpmisc)

#Loading the data
df <- iris
df.m <- melt(df, id="Species")

#Calculating the summary statistics
summ <- df.m %>% 
  group_by(variable) %>% 
  summarize(min = min(value), max = max(value), 
            mean = mean(value), q1= quantile(value, probs = 0.25), 
            median = median(value), q3= quantile(value, probs = 0.75),
            sd = sd(value), skewness=skewness(value), kurtosis=kurtosis(value))

#Histogram plotting
p1 <- ggplot(df.m) + geom_histogram(aes(x = value), fill = "grey", color = "black") + 
  facet_wrap(~variable, scales="free", ncol = 2)+ theme_bw()

p1+geom_table_npc(data = summ, label = list(summ),npcx = 0.00, npcy = 1, hjust = 0, vjust = 1)

Это дает мне следующий график enter image description here

Каждый аспект имеет сводную статистику всех переменных. Я хочу, чтобы он показывал сводную статистику только о граненой переменной. Как это сделать?

1 Ответ

3 голосов
/ 02 апреля 2020

Вам нужно разделить данные. Кадр:

p1+geom_table_npc(data=summ,label =split(summ,summ$variable),
npcx = 0.00, npcy = 1, hjust = 0, vjust = 1,size=2)

enter image description here

или вложить итоговую таблицу, которая у вас есть:

summ <- summ %>% nest(data=-c(variable))

# A tibble: 4 x 2
  variable               data
  <fct>        <list<df[,9]>>
1 Sepal.Length        [1 × 9]
2 Sepal.Width         [1 × 9]
3 Petal.Length        [1 × 9]
4 Petal.Width         [1 × 9]

p1+geom_table_npc(data = summ,label =summ$data,
,npcx = 0.00, npcy = 1, hjust = 0, vjust = 1)
...