Пожалуйста, прости меня, потому что я чрезвычайно новичок в R Studio, поэтому я был бы признателен, если бы вы могли помочь, указав мне на документацию или что-то в этом роде.
У меня есть фрейм данных с именем GSS
имеет очень, очень много немаркированных строк и двух столбцов, помеченных COLOR
и STAGE
, среди других не относящихся к делу столбцов. STAGE
состоит из случайных значений от 1 до 100, в то время как COLOR
может быть только от 1 до 4. Я также создал коэффициент FCOL
, который классифицирует и перечисляет частоту значений в COLOR
, где 1 = Красный, 2 = синий, 3 = зеленый и 4 = желтый.
Я хотел бы создать таблицу, в которой средние значения и медианы значений в STAGE
имеют один и тот же цвет. Я попытался сделать это с помощью этого:
stats <- GSS %>%
group_by(COLOR) %>%
summarize(mean_stage = mean(STAGE),
median_stage = median(STAGE))
Это успешно вычисляет среднее значение и срединную стадию для цвета, как показано stats$mean_stage
и stats$median_stage
, производя правильные значения в ожидаемом порядке цвета, но работает table(stats)
создает очень трудную для чтения серию таблиц, заполненных единицами и нулями, которые, по-видимому, не указывают, какой цвет соответствует какому числу. В идеале я хотел бы иметь возможность группировать их по уровню в моем факторе FCOL
, где у меня есть столбец с «красным, синим, зеленым, желтым» рядом со столбцом с соответствующими средствами и столбцом с соответствующие значения. Однако запись group_by(FCOL)
дает мне ошибку, сообщающую, что столбец 'FCOL' неизвестен.
Как мне создать эту таблицу так, как я хочу? Я много занимался поиском, но не могу найти ничего, что объясняло бы, как связать мой фрейм данных с фактором, который я уже создал. Я использую библиотеки tidyverse и dplyr.