Функция sd возвращает NA при использовании group_by () и sumrize () в dplyr (нет значений NA в df) - PullRequest
0 голосов
/ 20 февраля 2020

У меня есть df с двоичной цифрой c переменная ответа (0 или 1) и несколько переменных ответа. Я пытаюсь создать таблицу, которая группируется по типу (переменная 3 уровня) и шаг (7 уровней). Я хочу средний ответ и стандартное отклонение для каждого типа на каждом шаге. Выходная таблица должна иметь 21 строку с 4 переменными: тип, шаг, среднее и сд.

Мой код выглядит следующим образом:

data <- data %>% group_by(step, type) %>% summarise(Response = mean(Response), dev = sd(Response))  

Выходная таблица правильно генерирует средние значения, но возвращает NA для всех значений sd. Я попытался использовать 'na.rm = TRUE', чтобы удалить значения NA, но в исходном df для ответа не было ни одного. Есть идеи?

1 Ответ

0 голосов
/ 20 февраля 2020

С ?sd:

Стандартное отклонение вектора длины один или нулевой длины равно 'NA'.

Вероятно, ваш запрос dplyr в результате выводится длина 1 или длина 0.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...