У меня есть фрейм данных, который называется данными. Кроме того, у меня есть 2057 столбцов и 197 строк в группе данных1, я хочу знать, какая строка похожа на другую. Я сделал это:
group1=pd.crosstab(data.column1,data.column2)
group1["EsDuplicado?"]=group1.duplicated(subset=group1.columns.difference(['BCP_Nombre_de_la_Matriz__c']),keep=False)
До сих пор он работал, и я добавил новый столбец со значением true (если строка похожа на другую) или false, если строка не похожа.
Я хочу знать, какие строки похожи, и точно знать их пару.
До сих пор мой стол был таким:
![enter image description here](https://i.stack.imgur.com/bfqXU.png)
Но я бы хотел что-то вроде этого:
![enter image description here](https://i.stack.imgur.com/65mIX.png)
Или, может быть, в этом нет необходимости, и, может быть, этого достаточно, если строки расположены рядом друг с другом, поэтому я знаю, какая строка похожа.
Я хочу что-то подобное, но в этом примере только В моем случае 2 столбца У меня есть 2057 столбцов:
найти повторяющиеся строки в pandas фрейме данных