Фрейм данных выглядит следующим образом:
df = pd.DataFrame({'k1':['one']*3 + ['two']*4,'k2':[1,1,2,3,3,4,4]})
Когда я проверяю дубликаты, я получаю логический индекс, выполняя df.duplicated()
, затем я использую его в качестве фильтра df[df.duplicated()]
, который показывает другой результатсравнивается с df.drop_duplicates()
В результате была создана дополнительная строка
2 one 2