Я хочу выделить повторяющиеся значения данных в двух разных столбцах кадра данных. Например:
df1:
item Node
A B
A C
A D
B A
C A
Я хочу, чтобы выходные данные выглядели так:
item Node Same
A B False
A C False
A D False
B A True
C A True
Я хочу показать дублирующиеся значения, например, если есть AB, я хочу выделить BA. Для этого я создал другой фрейм данных и поменял значения двух столбцов.
df2:
item node
B A
C A
D A
A B
A C
Я пытаюсь проверить как узел df1 ['item'] == df2 [' '] и df1 [' node '] == df2 [' item '], если значение равно true, значение повторяется. Поскольку A входит в элемент df1, он проверяет наличие A в узле df2 и, соответственно, проверяет, что соответствующий узел A A входит в столбец элемента df2.
import pandas as pd
import numpy as np
data=pd.read_excel(r'C:\Users\eumukar\Desktop\test data xl.xlsx')
df1=pd.DataFrame(data,columns=['item','node'])
df2=pd.DataFrame(data,columns=['node','item'])
df1['Same']=np.where((df1['item']==df2['node']) & (df1['node']==df2['item']),'True','False')
print(df1)
Я получаю вывод в виде:
item node Same
A B False
A C False
A D False
B A False
C A False