У меня есть фрейм данных, который содержит повторяющиеся имена столбцов.Теперь я пытаюсь объединить дубликаты столбцов в один столбец с помощью следующей команды (следующий кадр данных предназначен только для демонстрации. Он не содержит повторяющихся имен столбцов, но такая же проблема будет возникать и с дублирующимся именем столбца).
d=pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})
d['col2']=d['col2'].astype(str)
d['col1']=np.nan
d=d.groupby(lambda x:x, axis=1).sum(min_count=1)
the output is:
col1 col2
0 0.0 3.0
1 0.0 4.0
Но я ожидаю
the output is:
col1 col2
0 Nan 3.0
1 Nan 4.0
Я надеюсь, что при использовании min_count = 1 панды вернут NaN, когда все суммируемые столбцы равны NaN.Однако теперь он возвращает 0 вместо NaN.Есть идеи почему?