логика титанического CSV для выживших с кодом братьев и сестер - PullRequest
0 голосов
/ 09 января 2019

, когда я пытаюсь использовать titanic.csv, чтобы найти выживших, у которых есть братья и сестры, и non_surviviors, у которых есть братья и сестры. Результат, который я получаю, кажется логически неверным.

Поскольку в наборе данных все люди из первого класса с братьями и сестрами имеют 125. Так что в нем должны содержаться как выжившие, так и не выжившие люди, но используемый мной код не добавляет до 125 для первого класса для выживших и не выживших людей с братьями и сестрами.

alived_with_sib = (file [file ['sibsp']> = 1] .groupby ('pclass') ['pclass']. Count ()) & (file [file ['alived'] == 1]. GroupBy ( 'Pclass') [ 'Pclass']. COUN ()

not_survived_with_sib = (file [file ['sibsp']> = 1] .groupby ('pclass') ['pclass']. Count ()) & (file [file ['alived'] == 0]. GroupBy ( 'Pclass') [ 'Pclass']. кол-()

когда я использую код для alived_with_sib, я получаю 72 для первого класса. Когда я использую not_survived_with_sib, я получаю 121 для первого класса. Но общее количество людей в первом классе с братьями и сестрами составляет 125. Если я получу 121 для тех, кто не выжил, но у них есть братья и сестры, это не значит, что будет только 4 человека, которые ДОЛЖНЫ выжить и иметь братьев и сестер.

...