Группировка в R по ячейкам - PullRequest
0 голосов
/ 06 ноября 2018

Я пытаюсь сгруппировать данные в R по ячейкам Education-Experience-Year. Мой поиск привел меня к пакету dplyr, и я могу использовать такой код

by_EdExpT <- df1 %>% group_by(ED, EXP, YEAR)

для группировки данных. Но я не совсем уверен, как выполнять операции на нем. Является ли dplyr лучшим пакетом для этого, и как мне выполнять такие операции, как средства или регрессии?

1 Ответ

0 голосов
/ 06 ноября 2018

Это действительно зависит от того, что вы подразумеваете под выполнением операций. Вы можете использовать функцию summarise() из dplyr, например, для вычисления средних по группам. Это будет работать для всего, что производит один вывод на группу.

summarise(by_EdExpT, mean)

Если вам нужен обзор функций dplyr, вы можете использовать шпаргалку , чтобы проверить это.

mutate() может включать сводную статистику в ваши исходные данные, например:

iris %>% group_by(Species) %>% mutate(avg = mean(Sepal.Length))

добавит столбец avg, представляющий среднее значение Sepal.Length для Species, соответствующего наблюдению в каждой строке.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...