Назначение NA с использованием кавычек или нет в R - PullRequest
0 голосов
/ 31 мая 2018

У меня есть некоторые данные, где пропущенные значения не закодированы как NA, и я хотел бы изменить их на NA, чтобы они автоматически обрабатывались пакетом R, который вменяет пропущенные данные.Я использую следующий код:

levels(data$catagorical_var)[levels(data$categorical_var) == "BLANK"] <- NA

data$numeric_var[data$numeric_var == -2] <- NA

Мой вопрос: для категориальной переменной должны ли быть кавычки вокруг NA?Это имеет значение?Это дает мне разные результаты, когда я использую кавычки и без кавычек, и я не уверен, что это правильно.

1 Ответ

0 голосов
/ 31 мая 2018

Нет, вы не должны использовать кавычки.NA - отсутствующее значение R."NA" - это строка символов с буквами «N» и «A».

На самом деле существуют NA различных типов (для каждого из типов данных R).Они указаны с подчеркиванием, например, NA_integer_ или NA_character_.Но почти никогда не нужно их использовать, R автоматически выберет правильный.Точный вопрос на самом деле рассматривается в разделе Подробности ?NA (первый абзац):

NA символьного типа отличается от строки "NA".Программисты, которым нужно указать явную отсутствующую строку, должны использовать NA_character_ (вместо "NA") или устанавливать элементы на NA, используя is.na<-.

Ваш код, ..character vector.. <- NA попадает под« установить элементы на NA, используя is.na<-. »

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...