У меня есть набор данных опроса с NA в нескольких столбцах.Поэтому я решил выполнить многократное вменение, используя пакет «missForest» для вменения пропущенных значений.Это не было проблемой, однако после проверки моих данных я заметил, что многие из вмененных значений являются числовыми с десятичными значениями в столбцах, которые ранее были факторами.
Я предполагаю, что missForest требует, чтобы столбцы были числовыми (для него требуется data.matrix для x), чтобы он мог выполнить вменение.
NRMSE достаточно хорош, и средствастолбцы с вмененными значениями аналогичны столбцам с NA.
Я планирую использовать набор данных с вмененными значениями для многоуровневой линейной регрессии и в любом случае преобразовал бы столбцы фактора в числовые значения.
Должны ли эти вмененные значения, которые являются числовыми с десятичными знаками, представлять проблему?
finalmatrix <- data.matrix(final)
set.seed(666)
impforest <- missForest(finalmatrix, variablewise = TRUE, parallelize =
"forests")