У меня возникли некоторые проблемы с использованием R group_by и функций суммирования, и мне было интересно, не могли бы вы помочь мне. У меня есть таблица, подобная этой:
Category Frequency
First 1
First 4
Second 6
First 1
Third 1
Third 2
Second 6
First 2
Second 1
Я пытаюсь использовать dplyr group_by и суммировать, чтобы найти среднее значение столбца частоты. Вот мой пример кода:
table %>%
group_by(table$Category) %>%
summarize(meanfrequency = mean(table$frequency))
То, что я ожидал бы, было бы для таблицы, которая будет разбита, которая разбивает среднюю частоту, сгруппированную по отдельной категории, например:
Category Frequency
First 2
Second 4.33
Third 1.5
Однако, что я получаю, так это таблицу, сгруппированную по категориям, где каждая категория получает значение среднего значения ВСЕЙ таблицы, например так:
Category Frequency
First 2.66
Second 2.66
Third 2.66
Любой ключ к пониманию того, что здесь происходит? Я должен сказать, что я новичок, поэтому, возможно, я упускаю что-то очевидное. Я должен отметить, что в моей фактической таблице есть несколько переменных в таблице, кроме двух, которые я пытаюсь проанализировать, но не уверен, что это актуально или может что-то испортить. Я также загрузил эти данные в R, используя встроенный в Rstudio пакет readxcl.
Заранее спасибо!