У меня есть дубликаты клиентов с различным статусом, потому что для каждой подписки / продукта клиента есть строка.Я хочу сгенерировать new_status
для клиента и для его «отмены», каждый статус подписки должен быть «отменен» вместе.
Я использовал:
df['duplicated'] = df.groupby('customer', as_index=False)['customer'].cumcount()
для разделениякаждый дублируется в индексе для указания дублированных значений
Customer | Status | new_status | duplicated
X |canceled| | 0
X |canceled| | 1
X |active | | 2
Y |canceled| | 0
A |canceled| | 0
A |canceled| | 1
B |active | | 0
B |canceled| | 1
Таким образом, я хотел бы использовать .apply и / или .loc для генерации:
Customer | Status | new_status | duplicated
X |canceled| | 0
X |canceled| | 1
X |active | | 2
Y |canceled| | 0
A |canceled| canceled | 0
A |canceled| canceled | 1
B |active | | 0
B |canceled| | 1