Я хотел бы иметь новый фрейм данных только с строками, которые были дублированы в предыдущем df. Я попытался назначить новый столбец, который будет истинным, если есть дубликаты, а затем выбрать только те строки, которые являются истинными. Однако я получил 0 лиц. Я уверен, что у меня есть дубликаты в df. Я хочу сохранить в старом фрейме данных первые строки и удалить все остальные дубликаты. Столбец с повторяющимися значениями называется «объединенным»
df=df.assign(
is_duplicate= lambda d: d.duplicated()
).sort_values('merged').reset_index(drop=True)
df2= df.loc[df['is_duplicate'] == 'True']