Расчет среднего, SE и SD по общему числу, а не наблюдается - PullRequest
0 голосов
/ 10 февраля 2020

Я пытаюсь рассчитать среднее, sd и se частоты нескольких видов по количеству участков на среду обитания. У меня есть три участка на среду обитания и четыре типа среды обитания, так что всего двенадцать участков. Мой набор данных выглядит следующим образом

Site Species Habitat  Count

A      X   Wetland      3
B      T   Urban       12
B      U   Forest      18
C      Z   Grassland    3
C      Z   Grassland    6

Моя проблема в том, что не все виды регистрируются на каждом участке, и я получаю значения NA, когда запускаю код, а среднее значение вычисляется неправильно, поскольку не все виды были зарегистрированы в каждом сайте (N)

cdata <- ddply(df, c("Species", "Habitat"), summarise,
               N    = sum(Count),
               mean = mean(Count),
               sd   = sd(Count),
               se   = sd / sqrt(N))

Я пытался использовать mutate, а не суммировать, чтобы установить N в 3, число сайтов на среду обитания, но я все еще получаю значение NA для SD и SE

1 Ответ

0 голосов
/ 10 февраля 2020

Обходным путем может быть установка значений NA на 0 с. Это объясняется здесь: Установите NA на 0 в R

cdata.data[is.na(cdata.data)] <- 0

Возможно, не самое чистое, но кажется, что оно может работать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...