Question

Я делаю анализ Титани c из Kaggle. Я должен представить распределение данных -> Embarked vs Survived, и я хотел бы использовать график KDE вместо гистограмм. Я не знаю, возможно ли это, потому что объем данных неодинаков (Survived - 0 и 1 / Embarked - S, C и значение Q). Я преобразовал данные Embarked в 3 столбца, используя:

def_titanic = titanic
y = pd.get_dummies(def_titanic, columns=["Embarked"])
new_titanic = y

Divided Columns

Все, что я могу думать, это то, что выглядит, но выглядит не очень хорошо

plt.figure(figsize=(25, 10), dpi=100)
sns.kdeplot(new_titanic.Embarked_Q[titanic.Survived == 1], shade=True,
            color=fav[0], alpha=0.45, label='Q - 1')
sns.kdeplot(new_titanic.Embarked_C[titanic.Survived == 1], shade=True, 
            color=fav[-2], alpha=0.45, label='C - 1')
sns.kdeplot(new_titanic.Embarked_S[titanic.Survived == 1], shade=True, 
            color=fav[-3], alpha=0.45, label='S - 1')
sns.kdeplot(new_titanic.Embarked_Q[titanic.Survived == 0], shade=True,
            color=fav[2], alpha=0.45, label='Q - 0')
sns.kdeplot(new_titanic.Embarked_C[titanic.Survived == 0], shade=True, 
            color=fav[4], alpha=0.45, label='C - 0')
sns.kdeplot(new_titanic.Embarked_S[titanic.Survived == 0], shade=True, 
            color=fav[6], alpha=0.45, label='S - 0')
plt.legend()
plt.title("Title")
plt.gca().set(xlabel='Embarked', ylabel='%')

И результат:

Есть идеи?

Проблема с сюжетом при анализе Титани c -> sns.kdeplot

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Проблема с сюжетом при анализе Титани c -> sns.kdeplot

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов