У меня есть кадр данных в формате:
template is_a is_b is_c is_d is_e
0 cv_template 0 1 0 0 0
1 topic_template 1 0 0 0 0
2 model_template 1 0 0 0 0
3 model_template 0 1 0 0 0
Я бы хотел сгруппировать по template
и объединить столбцы is_
, которые являются двоичными значениями для каждого template
.
то есть в приведенном выше примере выходные данные будут такими:
template is_a is_b is_c is_d is_e
0 cv_template 0 1 0 0 0
1 topic_template 1 0 0 0 0
2 model_template 1 1 0 0 0
Мое текущее решение - сделать что-то вроде этого:
df.groupby('template', as_index=False)['is_a', 'is_b', 'is_c', 'is_d'].max()
Однако при работе с большими наборами данных группировка выполняется медленно. Мне было интересно, есть ли лучший способ сделать это, что ускорит процесс.