Как удалить повторяющиеся строки в дейтаграмме python и назначить новую дейтаграмму, но сохранить исходный фрейм необработанных данных - PullRequest
0 голосов
/ 03 августа 2020

Я новичок в python и ошибаюсь, кодируя python, как SAS. Есть ли способ удалить повторяющиеся строки на основе набора ключей из фрейма данных и назначить его новой дейтаграмме, сохранив исходный фрейм необработанных данных

1 Ответ

0 голосов
/ 03 августа 2020

пусть df будет вашим исходным фреймом данных, тогда:

import pandas as pd

#create a new df with duplicate rows removed
df2 = df.drop_duplicates(keep='first').reset_index(drop=True)
...