Я делаю анализ Титани c из Kaggle. Я должен представить распределение данных -> Embarked vs Survived, и я хотел бы использовать график KDE вместо гистограмм. Я не знаю, возможно ли это, потому что объем данных неодинаков (Survived - 0 и 1 / Embarked - S, C и значение Q). Я преобразовал данные Embarked в 3 столбца, используя:
def_titanic = titanic
y = pd.get_dummies(def_titanic, columns=["Embarked"])
new_titanic = y
![Divided Columns](https://i.stack.imgur.com/hF63lm.png)
Все, что я могу думать, это то, что выглядит, но выглядит не очень хорошо
plt.figure(figsize=(25, 10), dpi=100)
sns.kdeplot(new_titanic.Embarked_Q[titanic.Survived == 1], shade=True,
color=fav[0], alpha=0.45, label='Q - 1')
sns.kdeplot(new_titanic.Embarked_C[titanic.Survived == 1], shade=True,
color=fav[-2], alpha=0.45, label='C - 1')
sns.kdeplot(new_titanic.Embarked_S[titanic.Survived == 1], shade=True,
color=fav[-3], alpha=0.45, label='S - 1')
sns.kdeplot(new_titanic.Embarked_Q[titanic.Survived == 0], shade=True,
color=fav[2], alpha=0.45, label='Q - 0')
sns.kdeplot(new_titanic.Embarked_C[titanic.Survived == 0], shade=True,
color=fav[4], alpha=0.45, label='C - 0')
sns.kdeplot(new_titanic.Embarked_S[titanic.Survived == 0], shade=True,
color=fav[6], alpha=0.45, label='S - 0')
plt.legend()
plt.title("Title")
plt.gca().set(xlabel='Embarked', ylabel='%')
И результат:
![KdePlot](https://i.stack.imgur.com/2Vhe0m.png)
Есть идеи?