Значения NA, вызывающие проблемы в summaze () даже при использовании rm.na = TRUE - PullRequest
0 голосов
/ 06 марта 2019

Я пытаюсь взять среднее значение некоторых данных со значениями NA, и я хотел бы, чтобы значения NA игнорировались.Воспроизводимым примером будет:

     country      gdp
1    Austria    25.17
2 Azerbaijan       NA
3 Bangladesh    27.79
4    Belarus       NA
testdf2 <- data.frame(stringsAsFactors=FALSE,
     country = c("Austria", "Azerbaijan", "Bangladesh", "Belarus"),
         gdp = c(25.17654, NA, 27.7971, NA)
)

Я пробовал summarise() с использованием rm.na = TRUE и без

library(dplyr)
testdf2 %>% summarise(gdp_mean = mean(gdp))

testdf2 %>% summarise(gdp_mean = mean(gdp), rm.na = TRUE)

, но я продолжаю получатьвывод, который выглядит так:

  gdp_mean
1       NA

Может кто-нибудь сказать мне, что я делаю не так, пожалуйста?

1 Ответ

1 голос
/ 06 марта 2019

Я думаю, что вы сделали опечатку.Я попробовал ваш код следующим образом, и он работает: rm.na должно быть na.rm, и, конечно, то, что @kwiscion упомянул в своем комментарии!

testdf2 %>% summarise(gdp_mean = mean(gdp, na.rm = TRUE))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...