Как объединить определенные столбцы из фрейма данных по уникальному идентификатору? - PullRequest
0 голосов
/ 13 ноября 2018

У меня есть список данных статкаста за день, начиная с 2016 года. Я пытаюсь объединить эти данные для нахождения среднего значения для каждого идентификатора передачи.

У меня есть следующий код:

aggpitch <- aggregate(pitchingstat, by=list(pitchingstat$PitcherID),
                  FUN=mean, na.rm = TRUE)

Эта функция агрегирует каждый столбец.Я смотрю, чтобы собрать только определенное количество столбцов.

Как бы я включил только определенные столбцы?

Ответы [ 3 ]

0 голосов
/ 13 ноября 2018

Как насчет?:

library(tidyverse)
aggpitch <- pitchingstat %>% 
  group_by(PitcherID) %>% 
  summarise(pitcher_mean = mean(variable)) #replace 'variable' with your variable of interest here

или

library(tidyverse)
aggpitch <- pitchingstat %>%
  select(var_1, var_2)
  group_by(PitcherID) %>% 
  summarise(pitcher_mean = mean(var_1),
            pitcher_mean2 = mean(var_2))

Я думаю, что это работает, но можно использовать фиктивный пример ваших данных для игры.

0 голосов
/ 13 ноября 2018

Если у вас есть более одного столбца, который вы хотите суммировать, вы можете использовать подход QAsena и добавить функцию summarise_at следующим образом:

pitchingstat %>%
group_by(PitcherID) %>%
summarise_at(vars(col1:coln), mean, na.rm = TRUE)

Проверьте ссылку ниже для большего количества примеров: https://dplyr.tidyverse.org/reference/summarise_all.html

0 голосов
/ 13 ноября 2018

Заменить первый аргумент (pitchingstat) именем столбца, который вы хотите агрегировать (или его вектор)

...