Ошибка вычисления среднего значения, стандартной ошибки и стандартного отклонения с использованием функции ddply - PullRequest
0 голосов
/ 30 января 2020

Я пытаюсь вычислить среднее значение, стандартную ошибку и стандартное отклонение, используя функцию ddply apply, но выходных данных нет. В этом наборе данных нет «NA», поэтому пропущенные данные не должны быть проблемой. И среда обитания, и виды являются факторами.

Вот небольшая выборка моего набора данных

Habitat   Species      Count
   A         T           3
   A         T           4
   A         U           5
   B         V           12
   C         V           3
   D         X           2

Это копия кода для выполнения расчетов, но результат для среднего значения отображается в виде значений для 'Count' в исходном наборе данных, и все значения для sd и se равны 'NA'

cdata <- ddply(dataset, c("Species", "Habitat"), summarise,
               N    = sum((Count),
               mean = mean(Count),
               sd   = sd(Count),
               se   = sd / sqrt(N))

Я также использовал функцию sumrizeBy () и функцию агрегирования. Был бы очень признателен, если бы кто-то мог посоветовать мне требования к использованию функции ddply и что может быть причиной этой ошибки.

1 Ответ

0 голосов
/ 30 января 2020

Этот код отлично работает:

require(plyr)
require(tidyverse)

dataset <- data.frame(Habitat = c("A","A","A","B","C","D"),
            Species = c("T","T","U","V","V","X"),
            Count = c(3,4,5,12,3,2))

cdata <- ddply(dataset, c("Species", "Habitat"), summarise, N    =sum(Count),mean =mean(Count),sd   =sd(Count)  )

cdata$se <- cdata$sd / cdata$N

для вычисления se Я добавляю еще один шаг ради сложности.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...