Панды - выделить строку данных дубликатов - PullRequest
0 голосов
/ 01 мая 2018

Чтобы улучшить мой вопрос

Как проверить, есть ли такой же Cntr_No и тот же Total_Amount

'HLBU 1234567' и 100 повторяются.

данные:

 df1 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})
 df2 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})    

выход: * +1010 *

  Cntr_No         Total_Amount     Duplicate
0  HLBU 1234567           100         Yes
1  HLBU 1234567           100         Yes

1 Ответ

0 голосов
/ 04 мая 2018

Вы можете использовать pd.DataFrame.duplicated, чтобы получить дублированные строки в виде серии. Ключевое слово keep = False помечает все дубликаты как True. Карта затем переименует Истинные / Ложные значения в Да / Нет.

df1['Duplicate'] = df1.duplicated(keep=False).map({True:'Yes', False:'No'})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...