У меня есть следующий код:
df = pd.read_csv('/pr1/test/data.csv')
dupes = df[df.duplicated(subset=['state','county', 'name'], keep=False)]
dupes.to_csv('/pr1/test/duplicates.csv')
Информационный кадр:
state county name
MS 95 Woodland Heights
MS 105 Woodland Heights
VA 179 Woodlawn
VA 775 Woodlawn
VA 179 Woodlawn
VA 775 Woodlawn
Желаемый выход:
state county name
VA 179 Woodlawn
VA 775 Woodlawn
Токовый выход:
state county name
Есть мысли о том, как собрать дубликаты данных?