Я использую набор данных, в котором пропущенные значения переменных указаны с указанием c чисел. Я пытаюсь создать один фрейм данных, где я заменяю эти значения пробелами, а другой фрейм данных, где я заменяю их NA. В этом вопросе я остановлюсь на фрейме данных, где они заменены на NA.
Для переменных отсутствующие значения определяются числами 8 или 9. Мне кажется, что я мог бы использовать mutate_at (), чтобы изменить их все или, возможно, функцию apply (), но я открыт для любых предложений. , Общая логика c, которую я пытаюсь записать, такова: для каждого указанного столбца, если значение равно 8 или 9, замените его пустым, иначе оставьте значение таким же.
Набор данных структурирован так, чтобы каждый столбец представляет одну переменную. Я пытаюсь выбрать подмножество переменных в кадре данных, так как только несколько столбцов имеют пропущенные значения. Я посмотрел на этот пример , но он не полностью отвечает на мой вопрос.
Я знаю, что мог бы сделать что-то подобное, но для этого потребовалось бы указать значения всех других значений, не пропущенные значения в кадре данных. Я бы предпочел решение, в котором я могу указать, что происходит с 8-ми и 9-ю (отсутствующие значения), а другие можно оставить без изменений.
mutate_at(vars(card, lung, diabetes), function(x) case_when (x == 8 ~ "NA", x == 9 ~ "NA", x == 6 ~ 6, x == 4 ~ 4, x == 3 ~ 3, x == 2 ~ 2, x == 1 ~ 1))