У меня есть DataFrame, сгруппированный по категориям.
Например, у меня есть df
df[['APP_NO', 'REPAY_METHOD', 'RESIDUAL_DEBT']] \
.groupby(['APP_NO', 'REPAY_METHOD']).agg({'RESIDUAL_DEBT' : 'sum'})
ID NUM CAT_FEAT aggr
1 123 2 1233
2 234 2 6631
3 576 -1 -491
4 987 0 5461
NUM - уникальный идентификатор
В результате я хочу получить следующий daraframe:
ID NUM CAT_FEAT aggr_CF2 aggr_CF0 aggr_CFm1
1 123 2 1233 -1 -1
2 234 2 6631 -1 -1
3 576 -1 -1 -1 -491
4 987 0 -1 5461 -1
То есть для каждого NUM получить тег aggr со всеми значениями CAT_FEAT
Если NUM не имеет значения из CAT_FEAT, заменить его на -1
Вопрос в том, как это реализовать наиболее правильно. Текущий df уже сгруппирован по NUM. У меня есть DataFrame, без группировок. Возможно я изначально не правильно мыслил.