Удалить дубликаты с помощью Python панды - PullRequest
0 голосов
/ 06 октября 2019

Я хочу удалить всю запись с условием

import pandas as pd
import numpy as np

# Create a DataFrame
d = {
    'Name':['Alisa','Bobby','jodha','jack','raghu','Cathrine',
        'Alisa','Bobby','kumar','Alisa','Alex','Cathrine'],
        'Age':[26,24,23,22,23,24,26,24,22,23,24,24],
        'Score':[85,63,55,74,31,77,85,63,42,62,89,77]}
df = pd.DataFrame(d,columns=['Name','Age','Score'])
df

Я хочу удалить всю запись "Алисы", которая является дубликатом, поскольку у нее балл = 85

Я пыталсяниже код, но он по-прежнему отображает «Алиса»

df1 = df[df['Score']==85]
df.drop_duplicates(['Name'])

1 Ответ

1 голос
/ 06 октября 2019

Если вы хотите удалить все дубликаты, где «Оценка» равна 85, вы можете использовать следующее решение:

df1 = df[df['Score'] == 85].drop_duplicates(keep='last')
df.drop(df1.index, inplace=True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...