Выделение дублирующихся значений из двух столбцов в Excel с помощью Pandas - PullRequest
0 голосов
/ 02 апреля 2019

Я пытаюсь сравнить два столбца в Excel для дублирования значений между ними.

Мне удалось извлечь данные из обоих столбцов, но я не могу выделить дублированные значения или даже узнать, действительно ли я вытащил дубликаты

Это пример из моего DataFrame

dataframe

мой код ниже.

import pandas as pd

data = pd.read_excel('beachfront.xlsx')

df = pd.DataFrame(data)


def duplicated(df):
    df[df.duplicated(subset=['Publisher Name', 'Supply Tag'], keep=False)]


print(df)

Это то, что я получаю в терминале после запуска блока кода

Imgur

Мне бы хотелось, чтобы дубликаты выделялись на листе Excel после запуска кода.

Любые указатели были бы хорошими.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...