Как сделать новый столбец с «дубликатом и уникальностью» - PullRequest
0 голосов
/ 21 октября 2019

My .csv file

IP
192.168.1.1
192.168.1.1
192.168.1.2
192.168.1.3

Если найден дубликат, создайте новый столбец с указанным.

Ожидаемый результат:

IP             un_dup
-------------------------
192.168.1.1    duplicate
192.168.1.1    duplicate
192.168.1.2    unique
192.168.1.3    unique

Мой код для поискадубликат

IP = [('192.168.1.1'),
      ('192.168.1.1'),
      ('192.168.1.2'),
      ('192.168.1.3')]
dfIP = pd.DataFrame(IP, columns=['IP'])
dfIPdup = dfIP[dfIP.duplicated()]

#logic is we got the duplicate and now add a column and mention 'duplicate' or unique

1 Ответ

1 голос
/ 21 октября 2019

Это должно работать:

import pandas as pd
import numpy as np

df = pd.read_csv('input.csv')
df['un_dup'] = np.where(df['IP'].duplicated(keep=False),'duplicate', 'unique')

print(df)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...