Поскольку при использовании параметра keep = False
:
main = pd.DataFrame({'BoardID':[1,1,2,3,4,4,4],
'Revenue':[4,1,2,5,4,5,7]})
main.drop_duplicates(subset ="BoardID",
keep = False, inplace = True)
print (main)
BoardID Revenue
2 2 2
3 3 5
удаляются только дублированные значения, уникальные строки не пропускаются.
Для одинаковой длины необходимо keep = 'first'
для первого уникального и дублированногозначения:
main.drop_duplicates(subset ="BoardID",
keep = 'first', inplace = True)
то же самое, что опущено, потому что параметр по умолчанию:
main = pd.DataFrame({'BoardID':[1,1,2,3,4,4,4],
'Revenue':[4,1,2,5,4,5,7]})
main.drop_duplicates(subset ="BoardID", inplace = True)
print (main)
BoardID Revenue
0 1 4
2 2 2
3 3 5
4 4 4