Я не могу удалить указанные c значения во фрейме данных в python - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть pandas фрейм данных, который я сделал, используя текстовый файл в Python. Мне удалось прочитать данные и создать фрейм данных, но после некоторой обработки у меня появилось много избыточных значений в моем фрейме данных, и я хочу удалить повторяющиеся значения. Я попытался использовать

df2 = df1.drop_duplicates(subset=['FROM', 'ATTENDANCE'], keep = 'last', inplace=False)
df2

enter image description here

, но повторные данные есть и не удаляются. Я перепробовал все с drop_duplicates (), и у меня ничего не получалось.

1 Ответ

1 голос
/ 15 апреля 2020

Из вашего колба df1 является копией другого df, поэтому вы не можете реально изменить значения его столбцов. Вы должны сделать:

df1 = df[['FROM', 'ATTENDANCE']].copy()
df1['FROM'] = df1['FROM'].str.strip()

df2 = df1.drop_duplicates(keep='last')

Вывод:

                  FROM ATTENDANCE
2           Usha Dubey    PRESENT
9   Pranjal Srivastava    PRESENT
11       Jagriti Gupta    PRESENT
12         Samaksh X A    PRESENT
13        Bhavya Malik    PRESENT
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...