Перестановка факторов внутри набора данных - PullRequest
0 голосов
/ 27 февраля 2019

У меня есть этот набор данных с именем HAPPY, который имеет несколько разных столбцов (ВОЗРАСТ, МОРСКАЯ, СТЕПЕНЬ ... и т. Д.).У меня есть эти столбцы, чтобы быть факторными переменными, и я пытаюсь изменить уровни в факторе, чтобы они были в порядке, который имеет смысл.Например, я пытаюсь переставить семейные факторы в c («Никогда не был женат», «Женат, разлучен», «Разведен», «Вдовец»). Я должен использовать для этого Dplyr. Возможно, с помощью упорядочить, суммировать иgroup_by. Это то, что я сделал, но это совсем не близко, и я изо всех сил пытаюсь понять это:

HAPPY %>% group_by(MARITAL) %>% summarize(n = n(), solo = mean(AGE)) %>% arrange(desc(solo))

Спасибо за ваше время!

https://xdaiisu.github.io/ds202materials/hwlabs/HAPPY.rds вот ссылка на данные

1 Ответ

0 голосов
/ 27 февраля 2019

После прочтения вашего файла rds я заметил, что столбец MARITAL не символ, а символ.Преобразовать его в коэффициент можно следующим образом с помощью функции mutate.После этого вы можете изменить порядок строк, используя arrange с desc, чтобы сделать его в порядке убывания.

library(dplyr)

HAPPY2 <- HAPPY %>%
  mutate(MARITAL = factor(MARITAL, 
                          levels = c("NEVER MARRIED", "MARRIED", "SEPARATED", "DIVORCED", "WIDOWED"))) %>%
  arrange(desc(MARITAL))

Мне неясно, почему вы хотите использовать summarize и group_by,Если у вас есть новый вопрос, уточните.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...