Как удалить строку, если комбинация столбцов совпадает с Panda Dataframe - PullRequest
1 голос
/ 20 мая 2019

У меня есть фрейм данных pandas, который выглядит следующим образом.

'Column1' 'Column2' 'Column3'
'cat'     'bat'.    '100'
'toy'    'flower'.  '80'
'bat'    'cat'      '100'

Если комбинация столбца 1 и столбца 2 в этом случае одинакова, в этом случае «кошка с битой» в строке 1 и строке 3 я хочу удалить1 ряд

Полученный кадр данных должен иметь только.

'Column1'  'Column2' 'Column3'
'cat'.     'bat'.     '100'
'toy'.     'flower'.  '80'

1 Ответ

4 голосов
/ 20 мая 2019

Первая сортировка по np.sort для повышения производительности, создайте DataFrame и отфильтруйте по DataFrame.duplicated с boolean indexing с инвертированной маской по ~

mask = pd.DataFrame(np.sort(df[['Column1','Column2']], axis=1), index=df.index).duplicated()

df1 = df[~mask]
print (df1)
  Column1   Column2 Column3
0   'cat'     'bat'   '100'
1   'toy'  'flower'    '80'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...