У меня есть фрейм данных, sega_df
:
Character Month Code
Sonic 18-Jan P008924
Shadow 18-Jan P007869
Sonic 18-Feb P007811
Sonic 18-Feb P008639
Sonic 18-Mar P008242
Sonic 18-Mar P007823
Sonic 18-Mar P007823
Sonic 18-Mar P008380
Sonic 18-Apr P008637
Shadow 18-Apr P008266
В моем желаемом выводе я хотел бы посчитать количество уникальных кодов в месяц на символ.Что означает, например, для Sonic
за март месяц, я хотел бы видеть всего 3, а не 4 (игнорируя, как P007823
встречается дважды, и для него есть три кода на март месяц).Мой желаемый результат:
Jan 18 Feb 18 Mar 18 Apr 18
Character
Sonic 1.0 2.0 3.0 1.0
Shadow 1.0 0.0 0.0 1.0
Я попытался .count()
и .unstack()
и подумал об использовании .sum()
в конце.Мой код до сих пор:
sega_pivot = sega_df.groupby(['Character','Month']).count().unstack()