Граф Seaborn показывает неверные результаты на наборе данных Титаник - PullRequest
0 голосов
/ 30 октября 2019

Я работаю над набором данных Титаник, который я получил с этого сайта: https://public.opendatasoft.com/explore/dataset/titanic-passengers/table/?flg=fr

Я хочу показать количество мужчин и женщин для каждого выжившего класса (да или нет).

Прежде всего я получил целое число мужчин и женщин, используя:

bysex=data1['Sex'].value_counts()
print(bysex)

Это дало мне следующие результаты:

male      577
female    314
Name: Sex, dtype: int64

Результаты показывают, чточисло людей мужского пола больше, чем женщин.

Но когда я использую морскую волю, чтобы показать число мужчин и женщин для каждого выжившего класса, используя этот код:

plot1 = sns.FacetGrid(data1, col='Survived')
plot1.map(sns.countplot,'Sex')

Тогда яполучить эти результаты: введите описание изображения здесь

Здесь показано, что число женщин больше, чем число мужчин, и для ни одного выжившего класса число женщин (около 450) является четнымбольше, чем общее число женщин (314).

Как это возможно?

1 Ответ

0 голосов
/ 30 октября 2019

Я думаю, что с отображением что-то не так. На левом графике Секс взаимозаменяемы.

data1.loc[data1["Survived"] == "No", 'Sex'].value_counts()
male      468
female     81
Name: Sex, dtype: int64

и второй сюжет прав.

data1.loc[data1["Survived"] == "Yes", 'Sex'].value_counts()
female    233
male      109
Name: Sex, dtype: int64

С другой стороны, когда вы используете

ax = sns.countplot(x="Survived", hue="Sex", data=data1)

, выполучить правильные результаты.

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...