Удаление дубликатов, появляющихся в двух или более столбцах Python - PullRequest
0 голосов
/ 31 марта 2020

Та же проблема, но это не помогло. Как решить KeyError: u "Ни один из [Index ([..], dtype = 'object')] в [столбцах]" Первая попытка:

df = pd.read_csv('ABCD.csv', index_col=['A'])
df=df.drop_duplicates(['A'],['B'])

KeyError: Index (['Sample_ID'], dtype = 'object')

Здесь я обнаружил, что невозможно удалить сам индекс, поэтому я удалил его сверху:

df = pd.read_csv('ABCD.csv')
df=df.drop_duplicates(['A'],['B'],keep = 'first')

TypeError: drop_duplicates () получил несколько значений для аргумента 'keep'

Когда я печатаю df (type), он отправляет "DataFrame", в чем может быть проблема

1 Ответ

1 голос
/ 31 марта 2020

Я думал, что это будет

df=df.drop_duplicates(['A', 'B'],keep = 'first')

вместо:

df=df.drop_duplicates(['A'],['B'],keep = 'first')

Подмножество должно быть списком столбцов, а не разделяться на несколько аргументов: метка подмножества столбца или последовательность меток, необязательно do c

PS: Вы должны использовать df.drop_duplicates(['A', 'B'], keep='first', inplace=True), вам не нужно присваивать обратно df при добавлении inplace

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...