Как создать фрейм данных, используя имя столбца, количество пропущенных значений и их процент - PullRequest
0 голосов
/ 24 ноября 2018
Missing_Values = data.frame(colSums(is.na(train)))
Missing_Values_per = data.frame(colMeans(is.na(train))) * 100
data.frame(Column_Name = names(train))

Мне нужно создать фрейм данных, используя эти три переменные, может кто-нибудь помочь с этим

1 Ответ

0 голосов
/ 24 ноября 2018

попробуйте это:

library(tidyverse)
train <- tibble(a = c(NA, 1, 4, NA, NA),
                b = c(6, NA, NA, NA, NA))

train %>% 
  gather(column_name, v) %>% 
  group_by(column_name) %>% 
  summarize(missing_values = sum(is.na(v)),
            missing_values_per = mean(is.na(v)) * 100)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...