Подобная проблема, как R идентификатор ссылки на запись , но в python.Алгоритм генерирует новую идентичность, которая не отражает правильную идентичность записей, которые были совпадают.Предполагая дублирование данных с одним кадром данных.
PS: Кажется, все в порядке в дублировании данных в примере
Столбец индекса, сгенерированный с помощью панд, необходимо отбросить и заменить предпочтительным столбцом в кадре данных, чтобы использовать его в качестве столбца идентификации.
Логика
replace index column with identify column in dataframe