Фиктивная переменная из двух столбцов в Python - PullRequest
0 голосов
/ 01 мая 2020

Я новичок в Python, поэтому мой вопрос может быть очень простым c, извините // Я пытаюсь создать одну фиктивную переменную для двух столбцов в Python. У меня есть столбец ( умер ), который сам по себе является пустышкой, где 1 соответствует смерти, 0 - смерти нет. Второй столбец - 'Возраст' , в котором указывается возраст смерти в месяцах. Мне нужно создать пустышку для детей, которые умерли до 5 лет ( «умер» == 1 & «возраст» <60 </strong>), и пустышку для детей, которые умерли до 1 года ( ' умер '== 1 & возраст' <12 </strong>). Я обычно работаю в Stata, в которой это очень легко, но в Python я борюсь. Я пытался использовать функцию get_dummies из pandas: dummy= pd.get_dummies(df['died']) & (df.aad < 60.).astype('int'), но она возвращает ошибку, из-за которой не может выполнить добавление, я предполагаю, что она не может добавить переменную индикатора 'died' с непрерывной переменной 'aad ». Существует ли простой (удобный для начинающих) способ объединения информации из двух столбцов для создания новой фиктивной переменной? Большое спасибо!

Ответы [ 2 ]

1 голос
/ 02 мая 2020

импорт numpy как np

df ['dummy'] = np.where ((df ['dead'] == 1) & (df ['aad'] <60), 1 , 0) </p>

0 голосов
/ 01 мая 2020

Вы можете сделать это довольно легко следующим образом:

dummy = ((df['died'] == 1) & (df['aad'] < 60)).astype('int')
...