Question

My .csv file

IP
192.168.1.1
192.168.1.1
192.168.1.2
192.168.1.3

Если найден дубликат, создайте новый столбец с указанным.

Ожидаемый результат:

IP             un_dup
-------------------------
192.168.1.1    duplicate
192.168.1.1    duplicate
192.168.1.2    unique
192.168.1.3    unique

Мой код для поискадубликат

IP = [('192.168.1.1'),
      ('192.168.1.1'),
      ('192.168.1.2'),
      ('192.168.1.3')]
dfIP = pd.DataFrame(IP, columns=['IP'])
dfIPdup = dfIP[dfIP.duplicated()]

#logic is we got the duplicate and now add a column and mention 'duplicate' or unique

luigigi · Answer 1 · 21 октября 2019

Это должно работать:

import pandas as pd
import numpy as np

df = pd.read_csv('input.csv')
df['un_dup'] = np.where(df['IP'].duplicated(keep=False),'duplicate', 'unique')

print(df)

Как сделать новый столбец с «дубликатом и уникальностью»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как сделать новый столбец с «дубликатом и уникальностью»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов