Создание нового столбца на основе условия для других столбцов - PullRequest
0 голосов
/ 14 июля 2020

Я пытаюсь создать столбец на основе условия в других столбцах.

В доме 5 человек возраста. Мне нужно подсчитать людей в этом доме разного пола и возраста.

Написанный мной код не работает

from pandas import DataFrame

df1 = pd.DataFrame({'member':[1,2], 'M1':[20,35],'M2':[27,42], 'M3':[77,62],'M4':[20,0],'M5':[0,35],
                    'G1':['M','F'],'G2':['M','F'],'G3':['M','F'],'G4':['M',0],'G5':[0,'F']})

#CODE WRITTEN
df1['M_20_to_30'] = ((df1[df1.columns[1:5]] >= 20) & (df1[df1.columns[1:5]] <= 30) & (df1[df1.columns[6:10]] == "M")).sum(1)


# EXPECTED OUTPUT
df1 = pd.DataFrame({'member':[1,2], 'M1':[20,35],'M2':[27,42], 'M3':[77,62],'M4':[20,0],'M5':[0,35],
                    'G1':['M','F'],'G2':['M','F'],'G3':['M','F'],'G4':['M',0],'G5':[0,'F'],'M_20_to_30':[2,0]})

1 Ответ

0 голосов
/ 14 июля 2020

Вы можете сделать:

df1['M_20_to_30'] = (df1
                     .iloc[:,df1.columns.str.startswith('M')]
                     .apply(lambda x: sum(x.ge(20) & x.le(30))), 1))

   member  M1  M2  M3  M4  M5 G1 G2 G3 G4 G5  M_20_to_30
0       1  20  27  77  20   0  M  M  M  M  0           3
1       2  35  42  62   0  35  F  F  F  0  F           0
...