Ух ты, слишком много для меня х . Но несколько толчков к ответу. Вы определенно не хотите, чтобы l oop опускал все строки вашего информационного кадра в этом случае. r
оптимизирован для работы на столбцах. Я не совсем уверен, что понимаю все ваши условия, но, скорее всего, dplyr::case_when
будет вам полезен.
Я собрал ваши данные и dput
только первые 20 строк. Затем я написал mutate
и case_when
, которые дают начало к closenessSupport
. Это то, чем вы занимаетесь?
Пересмотрено после вашего дополнительного ввода только интересующие колонки
# https://stackoverflow.com/questions/61582653
library(dplyr)
#>
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#>
#> filter, lag
#> The following objects are masked from 'package:base':
#>
#> intersect, setdiff, setequal, union
seniored <- structure(list(id = 1:20,
age = c(17L, 16L, 17L, 16L, 17L, 18L,
17L, 17L, 18L, 16L, 17L, 17L, 17L, 17L, 17L, 17L, 16L, 17L, 16L,
18L),
higherEd = structure(c(1L, 5L, 1L, 1L, 3L, 1L, 2L, 2L,
5L, 5L, 3L, 4L, 3L, 2L, 5L, 3L, 4L, 5L, 1L, 1L), .Label = c("2-year",
"4-year", "None", "Other", "Vocational"), class = "factor"),
riskGroup = structure(c(2L, 2L, 2L, 2L, 2L, 1L, 2L, 1L, 3L,
1L, 3L, 3L, 2L, 1L, 3L, 2L, 2L, 3L, 1L, 3L), .Label = c("High",
"Low", "Medium"), class = "factor"),
GPA = c(3.169, 2.703,
3.225, 2.488, 2.618, 2.928, 3.176, 3.256, 3.48, 3.244, 3.265,
3.4, 3.109, 3.513, 3.102, 2.656, 2.853, 3.046, 2.304, 3.473
),
closenessFriends = c(7L, 7L, 7L, 8L, NA, NA, NA, 6L, 7L,
NA, 5L, 6L, 3L, 1L, 1L, NA, 8L, 2L, NA, 8L),
closenessMentors = c(6L,
NA, 5L, NA, 5L, 4L, 8L, 6L, 4L, 5L, 4L, 4L, 4L, 5L, 5L, 5L,
3L, 4L, NA, 5L),
numSupportSources = c(2L, 1L, 2L, 1L, 1L,
1L, 1L, 2L, 2L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 0L, 2L
)), row.names = c(NA, 20L), class = "data.frame")
seniored %>%
mutate(
closenessSupport = case_when(
numSupportSources == 1 & !is.na(closenessFriends) ~ as.numeric(closenessFriends),
numSupportSources == 1 & !is.na(closenessMentors) ~ as.numeric(closenessMentors),
numSupportSources == 2 ~ (closenessFriends + closenessMentors)/2,
numSupportSources == 0 ~ NA_real_),
supportType = case_when(
numSupportSources == 1 & !is.na(closenessFriends) ~ "FriendOnly",
numSupportSources == 1 & !is.na(closenessMentors) ~ "MentorOnly",
numSupportSources == 2 ~ "Both",
numSupportSources == 0 ~ "Neither"
)
) %>%
select(numSupportSources, closenessFriends, closenessMentors, closenessSupport, supportType)
#> numSupportSources closenessFriends closenessMentors closenessSupport
#> 1 2 7 6 6.5
#> 2 1 7 NA 7.0
#> 3 2 7 5 6.0
#> 4 1 8 NA 8.0
#> 5 1 NA 5 5.0
#> 6 1 NA 4 4.0
#> 7 1 NA 8 8.0
#> 8 2 6 6 6.0
#> 9 2 7 4 5.5
#> 10 1 NA 5 5.0
#> 11 2 5 4 4.5
#> 12 2 6 4 5.0
#> 13 2 3 4 3.5
#> 14 2 1 5 3.0
#> 15 2 1 5 3.0
#> 16 1 NA 5 5.0
#> 17 2 8 3 5.5
#> 18 2 2 4 3.0
#> 19 0 NA NA NA
#> 20 2 8 5 6.5
#> supportType
#> 1 Both
#> 2 FriendOnly
#> 3 Both
#> 4 FriendOnly
#> 5 MentorOnly
#> 6 MentorOnly
#> 7 MentorOnly
#> 8 Both
#> 9 Both
#> 10 MentorOnly
#> 11 Both
#> 12 Both
#> 13 Both
#> 14 Both
#> 15 Both
#> 16 MentorOnly
#> 17 Both
#> 18 Both
#> 19 Neither
#> 20 Both
Создано в 2020-05-04 пакетом представ (v0.3.0)