Pd Groupby не группирует столбец в pd - PullRequest
0 голосов
/ 03 августа 2020

У меня есть df, который выглядит так:

Visitor_ID  Form Name   Page Views  Downloads (event9)  Video Start (event1)    Form Open (event10) Form Success (event11)
0   1000012332_3700058682   NaN 1   0   0   0   0
1   1000012332_3700058682   NaN 0   0   0   0   0
2   1000025219_4231004519   NaN 1   0   0   0   0
3   1000025219_4231004519   NaN 1   0   0   0   0
4   1000036902_602553643    NaN 1   0   0   0   0

Итак, я попытался сделать groupby на Visitor_ID следующим образом:

df = df.groupby(['Visitor_ID'])

Ожидается:

Visitor_ID  Form Name   Page Views  Downloads (event9)  Video Start (event1)    Form Open (event10) Form Success (event11)
0   1000012332_3700058682   NaN 1   0   0   0   0
1   1000025219_4231004519   NaN 2   0   0   0   0
2   1000036902_602553643    NaN 1   0   0   0   0   

Но я получил

Visitor_ID  Form Name   Page Views  Downloads (event9)  Video Start (event1)    Form Open (event10) Form Success (event11)
0   1000012332_3700058682   NaN 1   0   0   0   0
1   1000012332_3700058682   NaN 0   0   0   0   0
2   1000025219_4231004519   NaN 1   0   0   0   0
3   1000025219_4231004519   NaN 1   0   0   0   0
4   1000036902_602553643    NaN 1   0   0   0   0

Может кто-нибудь пролить свет на то, почему столбец «Visitor_ID» не группируется вместе?

1 Ответ

0 голосов
/ 03 августа 2020

Я думаю, вам, вероятно, следует использовать что-то, на чем он должен группироваться по

, вы можете использовать

df.groupby(['Visitor_ID']).sum()

OR

df.groupby(['Visitor_ID']).mean()

вот так, вы должны указать, какую операцию вы хотите выполнить на группа

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...