Как я могу удалить столбец из группы панд, если есть дубликаты? - PullRequest
0 голосов
/ 26 января 2019

Я запускаю df.groupby(['join', 'churn']).count(), и он возвращает это:

join     churn  
2016-05  2016-05      1
         2016-06      5
         2017-07      2
         2018-08      1
2016-06  2016-06      2
         2016-07      9
         2016-11      1
         2017-06      2

Как мне обработать эти данные дальше, чтобы они не возвращали строку при объединении == churn?

Что я хочу:

join     churn  
2016-05  2016-06      5
         2017-07      2
         2018-08      1
2016-06  2016-07      9
         2016-11      1
         2017-06      2

Ответы [ 2 ]

0 голосов
/ 26 января 2019

Вы можете сначала отфильтровать:

mask = df['join'] != df['churn']
df[mask].groupby(['join', 'churn']).count()
0 голосов
/ 26 января 2019

Фильтр до groupby

df.query('join!=churn').groupby(['join', 'churn']).count()
...