Вот другой подход, попробуйте:
df.groupby("Col1").agg(lambda x: ', '.join(x.unique())).reset_index()
Col1 Col2
0 a Jack, Jill, Adam
1 b Bob, Abel
2 c Cain, Sam
Что-то иметь в виду. Если ваш набор данных был примерно таким:
Col1 Col2
0 a Jack
1 a Jill
2 b Bob
3 c Cain
4 c Sam
5 a Adam
6 b Abel
7 a Adam
8 c Sam
Вы получите следующий вывод:
df.groupby("Col1").agg(lambda x: ', '.join(x)).reset_index()
Col1 Col2
0 a Jack, Jill, Adam, Adam
1 b Bob, Abel
2 c Cain, Sam, Sam
Таким образом, используя unique
, вы удаляете дубликаты в Col2
.
Надеюсь, что это поможет