Question

Этот код ранее работал в Python 3 для удаления дублирующихся значений, но сохраняет первое вхождение во всем фрейме данных.После возвращения к моему сценарию это больше не удаляет дубликаты в dataFrame pandas.

df = df.apply(lambda x: x.drop_duplicates(), axis=1)

, поэтому, если у меня есть

, я хочу получить в качестве вывода

Я не против, если пробелы возвращаются как 'nan'

Я также попробовал следующие

df.drop_duplicates(subset = None, keep='first')

и

df.drop_duplicates(subset = None, keep='first', inplace =True)

Любые советы / альтернативы будут приветствоваться!

WeNYoBen · Answer 1 · 27 ноября 2018

После того как вы приложили данные, я думаю, вы можете использовать duplicated

newdf=df[~df.stack().duplicated().unstack()]
newdf
Out[131]: 
      a    b     c
0   0.0  1.0   2.0
1   3.0  4.0   NaN
2   NaN  8.0   9.0
3  10.0  NaN  11.0

Toby Petty · Answer 2 · 27 ноября 2018

Вам нужно inplace, чтобы быть Истиной:

df.drop_duplicates(subset=None, keep='first', inplace=True)

drop_duplicates () перестал работать в пандах Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

drop_duplicates () перестал работать в пандах Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы