У меня есть датафрейм, как показано ниже, и я хочу сравнить строки между собой.После этого следует посчитать, как часто две строки во всех столбцах имеют значение один.
object |A|B|C|D|E
101 1 1 1 1 1
102 1 0 1 0 0
103 0 1 0 1 1
то, что я хочу увидеть (я поставил NaN, так как сравнивать одну и ту же строку с самим собой не имеет смысла).
101 | 102 | 103
101 NaN 2 3
102 2 NaN 0
103 3 0 NaN
Сейчас я делаю только это, но делаю это только для столбцов, а не для строк:
data=pd.DataFrame()#dummy
matrix=data.T.dot(data.T)