Как получить сводную описательную статистику для количественной переменной по качественной переменной? - PullRequest
0 голосов
/ 23 марта 2019

У меня есть набор данных, который дает мне экономию топлива на шоссе, среди других переменных для автомобилей с 4 и 6 цилиндрами. Я пытался использовать функцию group_by, которая не работает (следующий код)

Я установил и развернул / вызвал пакет dplyr, но он выдает ошибку

Ошибка в group_by (., Цилиндры): не удалось найти функцию "group_by"

Cars_filtered %>% group_by(Cylinders) %>% summarise(Min = min(Economy_highway,na.rm = TRUE),
                                                    Q1 = quantile(Economy_highway,probs = .25,na.rm = TRUE),
                                                    Median = median(Economy_highway, na.rm = TRUE),
                                                    Q3 = quantile(Economy_highway,probs = .75,na.rm = TRUE),
                                                    Max = max(Economy_highway,na.rm = TRUE),
                                                    Mean = mean(Economy_highway, na.rm = TRUE),
                                                    SD = sd(Economy_highway, na.rm = TRUE),
                                                    n = n(),
                                                    Missing = sum(is.na(price))

Я хочу увидеть сводную описательную статистику экономии топлива для различных автомобилей с 4 и 6 цилиндрами.

Есть ли другой способ это сделать?

1 Ответ

1 голос
/ 23 марта 2019

для этого было бы достаточно использовать tapply.

Используя набор данных mtcars, скажем, вас интересует сводная статистика MPG, сгруппированная по gear, вы можете использовать:

tapply(mtcars$mpg,mtcars$gear, summary)

Если вы хотите получить только сводную статистику для снаряжения «3» и «4», вы можете использовать add

tapply(mtcars$mpg,mtcars$gear, summary)[c("3", "4")]

Если вы хотите добавить, например, стандартное отклонение или размер выборки к итоговому выводу по умолчанию, вы можете определить свою собственную сводную функцию:

smmry <- function(x) c(summary(x), sd = sd(x), n = length(x))

tapply(mtcars$mpg,mtcars$gear, smmry)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...