Агрегирование наборов данных в R - PullRequest
0 голосов
/ 29 апреля 2020

У меня есть набор данных, который содержит данные о травмах НБА с 2010 по 2018 год. Данные были представлены «игроком», и я пытаюсь их агрегировать. так что это "по команде". У меня также есть травмы от игрока, и я хочу преобразовать травмы в «по команде». Как я смогу создать этот набор данных? Спасибо за вашу помощь!

dput(injuries[1:20,c(2,6)])
structure(list(Team = c("Chicago Bulls", "Detroit Pistons", "Detroit Pistons", 
"Portland Trail Blazers", "New Jersey Nets", "Detroit Pistons", 
"Detroit Pistons", "Denver Nuggets", "Milwaukee Bucks", "Sacramento Kings", 
"Charlotte Bobcats", "Golden State Warriors", "Phoneix Suns", 
"Miami Heat", "Oklahoma City Thunder", "Minnesota Timberwolves", 
"Miami Heat", "Milwaukee Bucks", "Milwaukee Bucks", "Memphis Grizzlies"
), body_part = c("finger", "achilles", "toe", "knee", "back", 
"achilles", "toe", "foot", "hip", "groin", "leg", "finger", "finger", 
"hand", "knee", "back", "ankle", "ankle", "ankle", "back")), row.names = c(NA, 
-20L), class = c("tbl_df", "tbl", "data.frame"))

Ответы [ 2 ]

0 голосов
/ 30 апреля 2020

Мы можем использовать summarise с group_by

library(dplyr)
injuries %>%
   group_by(Team, body_part) %>%
   summarise(n = n())
0 голосов
/ 29 апреля 2020

Вы можете использовать table для подсчета количества травм на Team:

table(injuries$Team, injuries$body_part)

Используя dplyr, это можно сделать как:

library(dplyr)
injuries %>% count(Team, body_part)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...