У меня есть такие данные. Я хочу создать графики этих данных для выполнения EDA с Python. Как я могу сохранить эти данные, чтобы я мог легко выполнить EDA?
party infants
democrat y 156
n 102
? 9
republican n 134
y 31
? 3
Что происходит из этого кода.
grouped = data.groupby('party')
print (grouped.infants.value_counts())
Я думаю, что я должен создать датафрейм для каждой партии с тремя столбцами y, n и? вот так.
democrat party dataframe
attr y n ?
infants 156 102 9
water
....
но как я могу автоматизировать этот процесс. Я не хочу писать всю эту информацию сам. У меня также есть данные в этом типе, которые поступают из этого кода.
df_out = data.groupby('party')['infants'].value_counts().unstack(-1).fillna(0)
infants ? n y
party
democrat 9 102 156
republican 3 134 31
обратите внимание, что вышеупомянутый фрейм данных содержит 16 столбцов, таких как младенцы, а выходной фрейм данных будет использоваться для анализа поисковых данных.