Я очень плохо знаком с R, но мне очень интересно учиться.
Так что я много искал, и хотя было много постов, посвященных проблеме подсчета пропущенных значений в нескольких столбцах с использованием
na_count <-sapply(data, function(y) sum(length(which(is.na(y)))))
na_count <- data.frame(na_count)
но не смог найти конкретный ответ на мою проблему.
У меня есть набор данных, в котором есть столбец с именем разновидности и другой столбец с именем вес, в котором есть некоторые пропущенные значения.
Мне нужно найти пропущенные значения в «весе», сгруппированном по видам. Мне нужно использовать group_by и суммировать.
Одна из ошибок, которые я получаю, это
Коэффициент species
содержит неявный NA, рассмотрите возможность использования forcats::fct_explicit_na
Я думаю, что это связано с тем фактом, что столбец, сгруппированный по '(видам), также имеет NA.
Я пытался
DF %>%
group_by(species) %>%
summarize(funs(sum(is.na(weight))))
Это не работает, хотя.
Наконец, мне нужно вписать средний вес каждого вида в пропущенные значения.
Приветствия