У меня есть столбец логического типа Self_Employed, значения как TRUE и FALSE. В нем отсутствуют значения, что означает «Сотрудник», а не работающий не по найму человек. Я хотел бы вменять категорию «Отсутствует» в столбце
class(df$Self_Employed)
[1] "logical"
levels(df$Self_Employed)
NULL
sum(is.na(df$Self_Employed))
[1] 210
table(df$Self_Employed)
FALSE TRUE
1561 271
получая класс как "логический", уровни как NULL и сумму пропущенных как 210, таблица показывает итоговое значение true и false.
вменять пропавшим
Сначала я конвертирую в множитель, затем вменяю пропущенное, но не заполняющееся, показывая только NA и уровни только с TRUE и FALSE
df$Self_Employed <- as.factor(df$Self_Employed)
levels(df$Self_Employed)[levels(df$Self_Employed)=="" ] <- "SE_Missing"
levels(df$Self_Employed)
[1] "FALSE" "TRUE"
Уровни показывают только True и False, а is.na показывает те же 210
df$Self_Employed <- factor(df$Self_Employed,levels=c('FALSE','TRUE',''),labels=c('Yes','No','SE_Missing'))
Как восполнить недостающий фактор
Мне нужно преобразовать True в «Да», False в «Нет», NA в «SE_Missing»