Как мне добавить сумму и рассчитывать на сводную таблицу - PullRequest
0 голосов
/ 08 июня 2018

Вот мой набор данных

customer_id hour    size
1              0       1
1              1      18
2              1       7

Вот мой код

table = a.pivot_table(index=['customer_id'], 
                      columns='hour', 
                      fill_value=0,
                      values='size')

Вот что у меня есть

hour            0   1
customer_id       
1               1  18
2               8   7

Что мне нужно

hour            0   1   count  sum
customer_id       
1               1  18       2   19
2               0   7       1    7
count           1   2
sum             1  25

count - это non-zero count в категории, а sum - сумма в категории

1 Ответ

0 голосов
/ 08 июня 2018

Одно возможное немного динамическое решение опущено fill_value=0:

table = a.pivot_table(index='customer_id', 
                      columns='hour', 
                      values='size')
print (table)
hour           0     1
customer_id           
1            1.0  18.0
2            NaN   7.0

a = table.agg(['count','sum'])
b = table.T.agg(['count','sum']).T

print (table.fillna(0).append(a).join(b))
         0     1  count   sum
1      1.0  18.0    2.0  19.0
2      0.0   7.0    1.0   7.0
count  1.0   2.0    NaN   NaN
sum    1.0  25.0    NaN   NaN
...