У меня есть датафрейм с большим количеством дубликатов.Я нашел много решений, чтобы найти количество дубликатов, но не так, как я хотел.Есть ли способ подсчитать дубликаты в новом столбце, если он содержит меньше или равно 2 дубликатам?
Кадр данных выглядит так:
NAME
0 Peter
1 Peter
2 Peter
3 Jack
4 Jack
5 Luke
Но я хочу, чтобы он выгляделкак это:
NAME Count
0 Peter 0
1 Peter 0
2 Peter 0
3 Jack 1
4 Jack 1
5 Luke 1
И затем отфильтруйте его (удалите строки) так, чтобы у меня был только кадр данных, где Count
равен 1
.
NAME Count
0 Jack 1
1 Jack 1
2 Luke 1
Если есть более простойспособ удалить дубликаты, то я рад услышать об этом.