Я пытаюсь добавить две колонки в набор данных игрока NBA.В первом столбце будет указано, какой возраст игрока относится ко всем игрокам в наборе данных.Во втором дополнительном столбце будет указано, в каком квартиле находится возраст отдельного игрока среди его позиций (например, Point Guard, Small Forward, Center и т. Д.).Я могу использовать пакет dplyr для вычисления квартилей подмножеств по возрасту на основе позиции игрока, но я не знаю, как присоединить его к исходному набору данных или если это даже правильный подход.
Я использовал dplyr для расчета подгрупп возрастных групп на основе позиции.Я пытался использовать другие пакеты, такие как fuzzyjoin, но не чувствовал себя комфортно с ними работать.
#Incorporate necessary packages
library(ballr)
library(magrittr)
library(dplyr)
library(tidyverse)
#Establish full player table
players <- NBAPerGameAdvStatistics(season = 2018)
#Calculates Quartiles for Each Position
Pos_quartiles <- players %>%
group_by(pos) %>%
summarise(age = list(enframe(quantile(age, probs=c(0.25,0.5,0.75,1.0))))) %>%
unnest
Я ожидаю, что у меня будет набор данных игроков с 664 наблюдениями и 32 переменными, последние два из которых былидобавлен в результате этой процедуры.В дополнительных строках будет показан возрастной квартиль игрока, основанный на всех включенных игроках, а также квартильный возраст игрока, основанный на его позиции.