Как я могу найти набор данных R с Факторами и NA - PullRequest
0 голосов
/ 22 марта 2019

Я ищу стандартный набор данных, прикрепленный к R-пакету, который я могу использовать для тестирования кода. Я обычно использую iris или mtcars, но они имеют только одну факторную переменную и не имеют пропущенных значений. Любые предложения для пакетов / наборов данных с многофакторными переменными и NA, или способов поиска во включенных наборах данных R для определенных критериев?

1 Ответ

3 голосов
/ 22 марта 2019

Вот программный способ поиска в наборах данных пакета для ваших желаемых характеристик:

available_datasets <- data(package='datasets')[['results']][, 3];

meets_reqs <- function(datasets) {
    sapply(datasets, function(ds) {
        dat <- get(sub(" .*", "", ds))
        hasfactors <- "factor" %in% sapply(dat, class)
        nas <- anyNA(dat)
        hasfactors && nas
    })
}

res <- meets_reqs(available_datasets)

res[1:3]
# AirPassengers                BJsales BJsales.lead (BJsales) 
#         FALSE                  FALSE                  FALSE 

res[res]
# attenu
#   TRUE
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...