У меня есть такой фрейм данных:
df = pd.DataFrame([[1, 2, np.nan],
[1, np.nan, 3],
[2, 2, 3],
[3, 4, np.nan]])
когда я groupby
все 3 столбца, а затем cumcount
, как и ожидалось, все возвращаемое значение должно быть 0, потому что в каждой группе только одна строка, но я получаю:
In [34]: df.groupby([0, 1, 2]).cumcount()
Out[34]:
0 0
1 1
2 0
3 2
dtype: int64
и мы видим, что все строки со значением nan
сгруппированы в одну группу, так что это ошибка или что-то, чего я не знаю?