R-Missing Data Analysis-интерпретация сюжета, сделанного extracat :: visna - PullRequest
0 голосов
/ 27 ноября 2018

Я просто использовал функцию visna () в пакете extracat для визуализации отсутствующих данных, но я не знаю, что означают синие ячейки?А как правильно интерпретировать гистограмму справа?

df <- data.frame(replicate(25,sample(0:1,1000,rep=TRUE)))
df2 <- as.data.frame(lapply(df, function(cc) cc[ sample(c(TRUE, NA), prob = c(0.85, 0.15), size = length(cc), replace = TRUE) ]))
# visualise the number of missings in cases using visna from extracat
extracat::visna(df2)

missing data plot

1 Ответ

0 голосов
/ 27 ноября 2018

Синие ячейки представляют пропущенные значения.

Для вашего фрейма данных это означает: переменная x1 имеет все свои пропущенные значения в конце вашего data.frame.Для переменной X25 пропущенные значения распределены по всему фрейму данных

Красная полоса ниже показывает количество пропущенных значений для этой переменной.Я думаю, что гистограмма справа - это количество полных строк для соответствующего блока данных.

Для хороших визуализаций недостающих данных также взгляните на пакет naniar.(https://cran.r -project.org / web / packages / naniar / vignettes / Getting-Start-w-naniar.html )

...