Question

Я пытаюсь сгруппировать данные в R по ячейкам Education-Experience-Year. Мой поиск привел меня к пакету dplyr, и я могу использовать такой код

by_EdExpT <- df1 %>% group_by(ED, EXP, YEAR)

для группировки данных. Но я не совсем уверен, как выполнять операции на нем. Является ли dplyr лучшим пакетом для этого, и как мне выполнять такие операции, как средства или регрессии?

Freguglia · Answer 1 · 06 ноября 2018

Это действительно зависит от того, что вы подразумеваете под выполнением операций. Вы можете использовать функцию summarise() из dplyr, например, для вычисления средних по группам. Это будет работать для всего, что производит один вывод на группу.

summarise(by_EdExpT, mean)

Если вам нужен обзор функций dplyr, вы можете использовать шпаргалку , чтобы проверить это.

mutate() может включать сводную статистику в ваши исходные данные, например:

iris %>% group_by(Species) %>% mutate(avg = mean(Sepal.Length))

добавит столбец avg, представляющий среднее значение Sepal.Length для Species, соответствующего наблюдению в каждой строке.

Группировка в R по ячейкам

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Группировка в R по ячейкам

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов