автоматически сохранять данные в датафрейме в EDA - PullRequest
0 голосов
/ 15 сентября 2018

У меня есть такие данные. Я хочу создать графики этих данных для выполнения EDA с Python. Как я могу сохранить эти данные, чтобы я мог легко выполнить EDA?

party       infants
democrat    y          156
            n          102
            ?            9
republican  n          134
            y           31
            ?            3

Что происходит из этого кода.

grouped = data.groupby('party')
print (grouped.infants.value_counts())

Я думаю, что я должен создать датафрейм для каждой партии с тремя столбцами y, n и? вот так.

democrat party dataframe
attr     y      n     ?
infants  156   102   9
water
....

но как я могу автоматизировать этот процесс. Я не хочу писать всю эту информацию сам. У меня также есть данные в этом типе, которые поступают из этого кода.

df_out = data.groupby('party')['infants'].value_counts().unstack(-1).fillna(0)


 infants    ?   n   y
 party          
 democrat   9   102 156
 republican 3   134 31

обратите внимание, что вышеупомянутый фрейм данных содержит 16 столбцов, таких как младенцы, а выходной фрейм данных будет использоваться для анализа поисковых данных.

...