Pandas - количество уникальных столбцов с суммой - PullRequest
0 голосов
/ 12 марта 2020

У меня есть следующий фрейм данных:

   x_1  x_2      x_3    x_4        x_5  ID  cost 
0  159  xyz  883nne2  28h93     lightz  10     2       
1  159  xyz  883nne2  28h93     lightz  10     5       
2  354  abc  94mmm4k             heavy  15     2       
3  354  abc  94mmm4k             heavy  15     1       
4  354  abc  94mmm4k   455h             15     7       
5  354  abc  94mmm4k             super   3     2       
6  354  abc  94mmm4k    53g             10     4   
7  354  abc  94mmm4k    53g             10     4   

Я хотел найти количество каждой уникальной комбинации для столбцов x_1, x_2, x_3, x_4, x_5, ID и получить сумму этих количеств и применить значение, найденное в столбце стоимости, чтобы получить общую сумму для каждой найденной уникальной комбинации.

Надеемся, что конечный результат будет выглядеть следующим образом:

   x_1  x_2      x_3    x_4        x_5  ID   count sum
0  159  xyz  883nne2  28h93     lightz  10       2   7      
1  354  abc  94mmm4k             heavy  15       2   3      
2  354  abc  94mmm4k   455h             15       1   7
3  354  abc  94mmm4k             super   3       1   2
4  354  abc  94mmm4k    53g             10       2   8

1 Ответ

1 голос
/ 12 марта 2020

Давайте сделаем groupby с agg

s=df.groupby(['x_1','x_2','x_3','x_4','x_5','ID'],as_index=False)['cost'].agg(['count','sum'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...