RStudio: организация средств и медиан групп по уровням факторов - PullRequest
0 голосов
/ 08 февраля 2020

Пожалуйста, прости меня, потому что я чрезвычайно новичок в R Studio, поэтому я был бы признателен, если бы вы могли помочь, указав мне на документацию или что-то в этом роде.

У меня есть фрейм данных с именем GSS имеет очень, очень много немаркированных строк и двух столбцов, помеченных COLOR и STAGE, среди других не относящихся к делу столбцов. STAGE состоит из случайных значений от 1 до 100, в то время как COLOR может быть только от 1 до 4. Я также создал коэффициент FCOL, который классифицирует и перечисляет частоту значений в COLOR, где 1 = Красный, 2 = синий, 3 = зеленый и 4 = желтый.

Я хотел бы создать таблицу, в которой средние значения и медианы значений в STAGE имеют один и тот же цвет. Я попытался сделать это с помощью этого:

stats <- GSS %>%
  group_by(COLOR) %>%
  summarize(mean_stage = mean(STAGE),
            median_stage = median(STAGE))

Это успешно вычисляет среднее значение и срединную стадию для цвета, как показано stats$mean_stage и stats$median_stage, производя правильные значения в ожидаемом порядке цвета, но работает table(stats) создает очень трудную для чтения серию таблиц, заполненных единицами и нулями, которые, по-видимому, не указывают, какой цвет соответствует какому числу. В идеале я хотел бы иметь возможность группировать их по уровню в моем факторе FCOL, где у меня есть столбец с «красным, синим, зеленым, желтым» рядом со столбцом с соответствующими средствами и столбцом с соответствующие значения. Однако запись group_by(FCOL) дает мне ошибку, сообщающую, что столбец 'FCOL' неизвестен.

Как мне создать эту таблицу так, как я хочу? Я много занимался поиском, но не могу найти ничего, что объясняло бы, как связать мой фрейм данных с фактором, который я уже создал. Я использую библиотеки tidyverse и dplyr.

1 Ответ

0 голосов
/ 08 февраля 2020

Проблема форматирования была исправлена ​​заменой table(stats) на print.data.frame(stats). Затем я заменил COLOR на FCOL на gss <- gss %>% mutate(COLOR = FCOL).

...