Почему функция pivot_table Pandas правильно суммирует некоторые значения, а другие пропускает - PullRequest
0 голосов
/ 17 июня 2019

У меня была проблема с кодом сводной таблицы, правильно читающим несколько значений при неправильном чтении других. Кто-нибудь когда-нибудь сталкивался с проблемой, подобной этой? С самого начала я инициировал функцию группировки, чтобы убедиться, что суммируемые значения суммируются правильно. Они были, и затем центр выбросил все из строя.

Я пробовал несколько методов (сгруппированные до pivot, loc), но ни один из них не решает проблему суммы

mask= (I_FY['Commodity'] == 'Urea (Solid)') | (I_FY['Commodity'] == 
'Other Urea')

df=I_FY.loc[mask]
UreaImp= df

UreaImp.groupby(['Year', 'FY','Month','Country']) 
['Volume'].sum().unstack()

UreaImp= pd.pivot_table(UreaImp, values = 'Volume', index=['Year', 'FY', 
'Month'], columns = ['Country']).reset_index()

Вот выборка данных до разворота

FY        Month   Country      Year   Volume
2018/19        1  Belgium      2019       1
2018/19        1  Canada       2019       1

Вот выражение проблемы данных после пивота

Year    FY        Month   Canada    Belgium
2019    2018/19     1      .5          1
...