Функция мыши не получает столбцы данных для вменения - PullRequest
0 голосов
/ 31 октября 2019

Когда я пытаюсь втиснуть пропущенные значения для моих данных, функция мышей не будет подбирать столбцы, в которых пропущены значения. Я пытаюсь заменить нулевые значения в BusinessTravel, но, используя приведенный ниже код, он не работает

    library(mice)

    mice_mod <- mice(my_ca_dataset[, !names(my_ca_dataset) %in% 
    c('EmployeeCount', 
'JobInvolvenent', 'NumCompaniesWorked', 'TrainingTimesLastYear')], method = 'rf')

    iter imp variable
1 1
1 2
1 3
1 4
1 5
2 1
2 2
2 3
2 4
2 5
3 1
3 2
3 3
3 4
3 5
4 1
4 2
4 3
4 4
4 5
5 1
5 2
5 3
5 4
5 5
Warning message:
Number of logged events: 4 

mice_output <- complete(mice_mod)
my_ca_dataset$BusinessTravel <- mice_output$BusinessTravel 

sapply(my_ca_dataset, function(x) sum(is.na(x)))


Age Attrition BusinessTravel DailyRate 
0 0 31 0 
Department EmployeeCount EnvironmentSatisfaction Gender 
0 36 0 0 
HourlyRate JobInvolvement JobLevel MonthlyRate 
0 0 0 0 
NumCompaniesWorked Over18 StandardHours StockOptionLevel 
45 0 0 0 
TotalWorkingYears TrainingTimesLastYear YearsAtCompany YearsWithCurrManager 
0 0 0 0

То, как нам нужно, чтобы это работало:

 iter imp variable
1 1 BusinessTravel
1 2 BusinessTravel
1 3 BusinessTravel
1 4 BusinessTravel
1 5 BusinessTravel
2 1 BusinessTravel
2 2 BusinessTravel
2 3 BusinessTravel
2 4 BusinessTravel
2 5 BusinessTravel
3 1 BusinessTravel
3 2 BusinessTravel
3 3 BusinessTravel
3 4 BusinessTravel
3 5 BusinessTravel
4 1 BusinessTravel
4 2 BusinessTravel
4 3 BusinessTravel
4 4 BusinessTravel
4 5 BusinessTravel
5 1 BusinessTravel
5 2 BusinessTravel
5 3 BusinessTravel
5 4 BusinessTravel
5 5 BusinessTravel

Нет ошибокнадеюсь, кто-то здесь сможет помочь

Краткое подмножество данных ниже A brief subset of the data is below

1 Ответ

0 голосов
/ 01 ноября 2019

Столбцы хранились как символы, а не как факторы, и не позволяли мышам работать правильно

...