R не может преобразовать NaN в NA для большого фрейма данных - PullRequest
2 голосов
/ 08 марта 2012

У меня есть приличный набор данных ~ 60 столбцов, который был случайно заполнен NaN вместо NA. Типы столбцов представляют собой сочетание символов, чисел, факторов и целых чисел. Мне нужно преобразовать NaN в NA, поскольку они запутывают работу над несколькими функциями, включая линейную регрессию. Я знаю, как изменить отдельный столбец из этого вопроса здесь:

R не может преобразовать NaN в NA

но мне любопытно, есть ли способ сделать это для полного кадра данных без потери типов векторов. Любые предложения или это ручная работа?

Ответы [ 3 ]

1 голос
/ 08 марта 2012

Будет ли это работать?(Должен использоваться для числовых, целых, символьных и факторных векторов.)

as.data.frame( lapply(dat, function(col) {
                 if (is.numeric(col)) { is.na(col) <- is.nan(col); return(col)} else {
                 if (is.character(col) || is.factor(col) )  {
                                              is.na(col) <- col == "NaN"; return(col)} else {
                 return(col)                                                                }
                                                                                     }
                                          }
               )

dat <- 
structure(list(tester1 = structure(c(1L, 1L, 2L, 3L, 1L, 2L, 
4L), .Label = c("2", "3", "4", "NaN"), class = "factor"), tester2 = c(2, 
2, 3, 4, 2, 3, NaN)), .Names = c("tester1", "tester2"), row.names = c(NA, 
-7L), class = "data.frame")

# Produced:

  tester1 tester2
1       2       2
2       2       2
3       3       3
4       4       4
5       2       2
6       3       3
7    <NA>      NA
1 голос
/ 08 марта 2012

Будет ли

gsub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,
     fixed = FALSE, useBytes = FALSE)

работать?

Может быть, вам понадобится смесь с apply.Не могли бы вы привести небольшой пример, чтобы я мог попытаться реализовать его?

Спасибо.

0 голосов
/ 06 марта 2015

Используя вышеупомянутый образец набора данных. Попробуйте это:

CMBv = colnames(dat)

dat[CMBv] = lapply(dat[CMBv], function(x){ifelse(is.nan(x), NA,x)} )
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...