Смена ярлыков на Viss_miss - PullRequest
0 голосов
/ 20 июня 2019

Я пытаюсь создать диаграмму отсутствия моих данных. Я запустил следующий код:

library(visdat)
library(naniar)

vis_miss(data, sort_miss = TRUE, show_perc = TRUE)

Однако метки employment.factor или вариант вместо Employment. Как я могу изменить этот ярлык?

Кроме того, все мои переменные в наборе данных включены сюда. Как выбрать, какие определенные переменные включены в диаграмму пропущенных?

1 Ответ

0 голосов
/ 20 июня 2019

Вместо того, чтобы изменять имена переменных после построения графика, можете ли вы изменить имена переменных на новое подмножество из фактического набора данных, ТОЧЕГО графика?Используя пакет dplyr:

library(dplyr)
data_subset <- select(data, A, B, C)
vis_miss(data_subset)

sort_miss = TRUE упорядочивает переменные по наибольшему отсутствию на оси x, которую вы включили vis_miss, возвращает объект ggplot, так что можно явно менять метки.Этот проект github, кажется, предоставил пример, использующий vis_miss и набор данных качества воздуха R: https://github.com/ropensci/visdat/blob/master/R/vis-miss.R

Вы можете получить порядок столбцов с наибольшим отсутствием:

na_sort <- order(colSums(is.na(data)), decreasing = TRUE)

Затем получите именаиз этих столбцов:

col_order_index <- names(data)[na_sort]

Соберите все переменные для построения графика (столбец номера строки, затем переменная, затем содержимое этой переменной)

dat_pre_vis <- as.data.frame(data.na[row_order_index , ])

Вы пытались вытянутьсправочная документация для? naniar, в которой перечислены все ее доступные функции, включенные в пакет?Некоторое объяснение использования naniar здесь: https://cran.r -project.org / web / packages / naniar / vignettes / naniar-visualisation.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...