Найдите медиану для каждой категории переменной в R - PullRequest
0 голосов
/ 06 мая 2020

Я изучаю R, и у меня проблемы с тем, как найти медианное значение и нарисовать координату в зависимости от медианы каждой категории переменной. Предположим, у меня есть фрейм данных, как показано ниже:

dat <- data.frame(
  time = factor(c("Breakfast","Breakfast","Breakfast","Lunch","Lunch","Lunch","Dinner","Dinner","Dinner"), levels=c("Breakfast","Lunch","Dinner")),
  total_bill_x = c(12.75,14.89,20.5,17.23,30.3,27.8,20.7,32.3,25.4), total_bill_y= c(20.75,15.29,18.52,19.23,27.3,23.6,19.75,27.3,21.48)
)

Я хочу нарисовать точки в координате (xy), соответствующие завтраку, обеду, ужину, где x - это медиана total_bill_x каждой категории, а y - медиана total_bill_y каждой категории. Например, для координаты завтрака я хочу, чтобы x = медиана (12,75,14,89,20,5) и y = медиана (20,75,15,29,18,52). Мы делаем то же самое для обеда и ужина, затем рисуем их в координате xy.

Любая помощь для этого была бы очень признательна.

1 Ответ

1 голос
/ 06 мая 2020

library (dplyr)
library(ggplot2)

dat %>% 
group_by(time) %>% # group your data 
summarise(
x = median(total_bill_x),
y = median(total_bill_y) # compute median
)%>%
ggplot(.,aes(x,y, col = time)) + #plot x,y
geom_point() 

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...