Изменение порядка уровней для многофакторных переменных - PullRequest
0 голосов
/ 27 апреля 2018

Я пытаюсь применить следующий код к моему фрейму данных, который называется факторизованным, но вместо того, чтобы изолировать одну переменную, которую я хотел бы идентифицировать для нескольких:

factored$DIABETES_FAMILY <- factor(factored$DIABETES_FAMILY, levels=c("Yes","No","Missing"))

В настоящее время порядок неверен: «Отсутствует», «Нет», «Да» У меня много переменных с этим неправильным порядком, поэтому, например, я попытался выполнить эту команду для двух столбцов следующим образом, но все мои наблюдения превратились в NA

factored[,2:3] <- factor(factored[,2:3], levels = c("Yes", "No" , "Missing"))

Любая помощь очень ценится!

1 Ответ

0 голосов
/ 27 апреля 2018

Нам нужно перебрать столбцы и назначить их столбцам как factor, так как аргумент x для factor принимает vector.

x- вектор данных, обычно принимающий небольшое количество различных значений.

на основании документации (?factor)

factored[2:3] <- lapply(factored[2:3], factor, levels = c("Yes", "No" , "Missing"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...