Шаги - код для отображения описания (среднее, SD и т. Д.) Для категориальных данных - PullRequest
0 голосов
/ 12 мая 2019

Я импортировал некоторые данные, включая расу, уровень образования и переменную результата в виде чисел.Изменены категориальные переменные на упорядоченные факторы.Что я могу сделать, чтобы описать эти данные?description.by не будет работать для меня, но я не знаю, если это правильная функция в любом случае.Я хочу просмотреть (историю) переменную результата независимо от рас, но также получить средства, SD и т. Д.

1 Ответ

0 голосов
/ 12 мая 2019

Всего несколько вещей.Всякий раз, когда вы пишете сообщение, я настоятельно рекомендую записать код, который вы пробовали, и предоставить некоторые поддельные данные, чтобы другие могли вам помочь.Хорошие вопросы быстрее дадут вам более сильные ответы.Например, я бы поставил некоторые фальшивые данные, такие как:

fake_data <- data.frame(
    race = sample(c("A", "B"), 100, TRUE),
    edu = sample(c("None", "Some", "More"), 100, TRUE),
    value = rnorm(100, 50, 10)
)

И если вы хотите получить некоторую базовую статистику населения, вы можете сделать что-то вроде этого:

library(dplyr)
fake_data %>% 
    group_by(race, edu) %>% 
    summarise(mu = mean(value),
                        sd = sd(value))

Затем, чтобы получить гистограммыВы можете сделать что-то вроде этого:

library(ggplot2)

fake_data %>% 
    ggplot(aes(value))+
    geom_histogram()+
    facet_wrap(~race)

Однако, без примера данных или желаемого результата, я могу только догадываться, что вы хотите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...