Как найти дисперсию подмножества данных в r? - PullRequest
0 голосов
/ 28 марта 2020

Я пытаюсь найти дисперсию подмножества целых данных (dat) «creationData.csv».

Мне нужна дисперсия уровней PM2.5, когда дождь = 0.

var(PM2.5, data=subset(dat, RAIN == 0))

Приведенный выше код не работает.

aggregate(dat[, 6], list(dat$RAIN==0), var, na.rm=TRUE)

Приведенный выше код выводит дисперсию, когда дождь = 0 и когда дождь> 0, но я хочу провести проверку гипотезы для отклонения, так что это не полезно.

Любая помощь будет оценена!

1 Ответ

0 голосов
/ 28 марта 2020

Мы можем установить подмножество 'PM2.5', где 'RAIN' равно 0, а затем взять var

with(dat, var(PM2.5[RAIN == 0], na.rm = TRUE))

Другой вариант - replace значения в 'PM2.5, где' RAIN 'равен 0 с NA, а затем применяется var

with(dat, var(replace(PM2.5,  RAIN == 0, NA), na.rm = TRUE))

aggregate требуется, когда мы хотим группировать по операции. Здесь мы получаем только var из PM2.5, где RAIN равен 0

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...