У меня есть датафрейм, как показано ниже. Я хотел бы сгруппировать их на основе subject_id, hadm_id и icustay_id. Как только я сгруппирую это, я хотел бы извлечь предметы, у которых есть больше чем 60% pc 1 в столбце 'val_bw_80_110'. Из приведенного ниже примера мы видим, что subject_id = 38 удовлетворяет этому условию (все значения для val_bw_80_110 = 1, что означает 100%), и я хотел бы извлечь группу, которая принадлежит subject_id = 38. Если бы было только два 1 тогда процент был бы 66.666 и т. д.
Я уже пытался использовать groupby, но не смог продолжить, так как не уверен, как получить процент значений в столбце
data = [[38,10,110,1,0,0], [38,10,110,1,0,0],[38,10,110,1,0,0],
[28,11,120,1,0,0],[28,11,120,0,1,0],[28,11,120,0,0,1],
[48,13,130,1,0,0],[48,13,130,0,1,0],[48,13,130,0,0,1]]
df = pd.DataFrame(data, columns =['subject_id','hadm_id','icustay_id',
'val_bw_80_110','val_lt_80','val_gt_110'])
new_df = df.groupby(['subject_id','hadm_id','icustay_id'])
Мой ожидаемый результат - это просто фрейм данных, который содержит все предметы, которые удовлетворяют условию 60% от 1 в val_bw_80_110. Выходной фрейм данных должен содержать все записи (вместе со столбцами) для subject_id = 38
.