Как создать и добавить новую переменную на основе суммы значений группы - PullRequest
0 голосов
/ 28 сентября 2019

У меня есть набор данных, называемый тест с несколькими наблюдениями на участника.Каждый участник имеет уникальный идентификатор, но несколько наблюдений (1 строка в данных = 1 наблюдение).Я должен уменьшить набор данных до 1 строки на участника и добавить две новые переменные, которые являются суммой нет.наблюдений за участником и суммой баллов, которые он или она получил за наблюдение.

Я уже получил эти значения, но как я могу создать и добавить эти две переменные в свой набор данных на основе этого кода?

test %>%
  group_by(id) %>%
  summarize(sum_communities = sum(id/id, na.rm = TRUE))
test %>%
  group_by(id) %>%
  summarize(sum_points = sum(points, na.rm = TRUE))

1 Ответ

0 голосов
/ 28 сентября 2019

Я создал демонстрационные данные в тестовой таблице.Таблица test_reduced имеет желаемый результат.

library(dplyr)
test = data.frame("Participent" =c("A","A","A","B","B","C","C","C", "C"), 
       "Observation" = c(4,5,6,4,7,4,6,6,3))
test_reduced = test %>% group_by(Participent) %>% 
                summarise(count = n(), sum = sum(Observation))

Выход:

 # A tibble: 3 x 3
  Participent count   sum
  <fct>       <int> <dbl>
 1 A               3    15
 2 B               2    11
 3 C               4    19
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...