Hy Everyone,
Я использовал для очистки данных с помощью SPSS и пытаюсь перейти на R.
У меня есть фрейм данных с историями рождения женщин за несколько лет, и янужно создавать и добавлять новые переменные, используя их.В основном, у меня есть переменные для каждого года от pa2010 до pa1996, которые представляют собой количество детей, которые женщина имела в начале года.Эти переменные являются числовыми, и я хочу преобразовать другие переменные с именами ppa2010 в ppa1996 как факторы и в то же время определить уровни и метки.Я сделал все это один раз, но я набрал каждую переменную и каждое условие.В последние дни я пытался вставить циклы, чтобы сделать мой код лучше, но безуспешно.
pa2010 <- c(0, 0, 2, 5, 3, 6, 8, 2, 1, 1)
pa2009 <- c(0, 0, 2, 4, 3, 6, 8 ,2, 0, 0)
pa2008 <- c(0, 0, 1, 4, 3, 5, 8, 1, 0, 0)
Parity <- data.frame(pa2010, pa2009, pa2008)
##I've been creating like this...
Parity %>% mutate(ppa2010 = ifelse(pa2010 >= 7, 7, pa2010),
ppa2009 = ifelse(pa2009 >= 7, 7, pa2009),
ppa2008 = ifelse(pa2008 >= 7, 7, pa2008)) %>%
mutate_(.vars = vars(ppa2010, ppa2009, ppa2008),
.funs = factor((levels = c(0, 1, 2, 3, 4, 5, 6, 7),
labels = c("Parity 0", "Parity 1", "Parity 2", "Parity 3", "Parity 4", "Parity 5", "Parity 6", "Parity 7+")))
Я хотел бы создать новые переменные, используя циклы или некоторые функции, которые ускоряют процесс.Кроме того, разверните фрейм данных, добавьте эти переменные в качестве факторов, потому что в будущем мне потребуется создать гистограммы для анализа, и этот процесс будет повторяться или пять раз.