Я постоянно применяю описанный ниже процесс, но мне хотелось бы знать, есть ли пакеты, упрощающие то, что я делаю. В идеале я хотел бы получить вывод графика и вывод данных кадра (titani c). Если у вас есть лучший способ анализа данных для достижения аналогичного результата (этот женский индекс ниже для третьего класса), все предложения приветствуются. Одна вещь, которая потеряна, является объемами; несмотря на то, что доля женщин в третьем классе ниже, общее количество в третьем классе может составлять 2-3 человека, следовательно, незначительное. Спасибо
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
titanic = sns.load_dataset('titanic')
titanic = titanic[['sex','class']]
titanic = titanic.groupby(['sex','class']).size()
titanic = titanic.reset_index().rename(columns={0:'count'})
titanic = titanic.pivot('class','sex','count')
titanic['female_share'] = titanic['female']/titanic['female'].sum()
titanic['male_share'] = titanic['male']/titanic['male'].sum()
titanic['share_difference'] = titanic['female_share'] - titanic['male_share']
sns.barplot(x=titanic.index,y='share_difference',data=titanic)
plt.title('Class Share difference: Female - Male')