Группировка панд по нескольким столбцам и расчет стандартного отклонения - PullRequest
1 голос
/ 31 октября 2019

У меня есть датафрейм pandas, который содержит статистику баскетболистов из NBA из разных сезонов и команд. Это выглядит так:

Year         Team          Player            PTS/G 
2018         Lakers        Lebron James      27.6
2018         Lakers        Kyle Kuzma        10.3
2019         Rockets       James Harden      25.5
2019         Rockets       Russel Westbrook  23.2

Я хочу создать новый столбец под названием «PTS Dev», который является стандартным отклонением PTS / G для каждой команды и года. Затем я планирую проанализировать, где находится игрок в соответствии с этим отклонением. Это моя попытка вычислить этот столбец:

final_data['PTS Dev'] = final_data.groupby('Team', 'Year')['PTS/G'].std()

1 Ответ

1 голос
/ 31 октября 2019

Использование groupby с transform

final_data['PTS Dev'] = final_data.groupby(['Team', 'Year'])['PTS/G'].transform('std')
final_data
Out[9]: 
   Year     Team            Player  PTS/G    PTS Dev
0  2018   Lakers      Lebron James   27.6  12.232947
1  2018   Lakers        Kyle Kuzma   10.3  12.232947
2  2019  Rockets      James Harden   25.5   1.626346
3  2019  Rockets  Russel Westbrook   23.2   1.626346
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...