, когда я пытаюсь использовать titanic.csv, чтобы найти выживших, у которых есть братья и сестры, и non_surviviors, у которых есть братья и сестры. Результат, который я получаю, кажется логически неверным.
Поскольку в наборе данных все люди из первого класса с братьями и сестрами имеют 125. Так что в нем должны содержаться как выжившие, так и не выжившие люди, но используемый мной код не добавляет до 125 для первого класса для выживших и не выживших людей с братьями и сестрами.
alived_with_sib = (file [file ['sibsp']> = 1] .groupby ('pclass') ['pclass']. Count ()) & (file [file ['alived'] == 1]. GroupBy ( 'Pclass') [ 'Pclass']. COUN ()
not_survived_with_sib = (file [file ['sibsp']> = 1] .groupby ('pclass') ['pclass']. Count ()) & (file [file ['alived'] == 0]. GroupBy ( 'Pclass') [ 'Pclass']. кол-()
когда я использую код для alived_with_sib, я получаю 72 для первого класса. Когда я использую not_survived_with_sib, я получаю 121 для первого класса. Но общее количество людей в первом классе с братьями и сестрами составляет 125. Если я получу 121 для тех, кто не выжил, но у них есть братья и сестры, это не значит, что будет только 4 человека, которые ДОЛЖНЫ выжить и иметь братьев и сестер.