Знать, какая строка похожа с другой в кадре данных - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть фрейм данных, который называется данными. Кроме того, у меня есть 2057 столбцов и 197 строк в группе данных1, я хочу знать, какая строка похожа на другую. Я сделал это:

group1=pd.crosstab(data.column1,data.column2)
 group1["EsDuplicado?"]=group1.duplicated(subset=group1.columns.difference(['BCP_Nombre_de_la_Matriz__c']),keep=False)

До сих пор он работал, и я добавил новый столбец со значением true (если строка похожа на другую) или false, если строка не похожа.

Я хочу знать, какие строки похожи, и точно знать их пару.

До сих пор мой стол был таким:

enter image description here

Но я бы хотел что-то вроде этого:

enter image description here

Или, может быть, в этом нет необходимости, и, может быть, этого достаточно, если строки расположены рядом друг с другом, поэтому я знаю, какая строка похожа.

Я хочу что-то подобное, но в этом примере только В моем случае 2 столбца У меня есть 2057 столбцов:

найти повторяющиеся строки в pandas фрейме данных

1 Ответ

0 голосов
/ 15 апреля 2020

Ответ @ss95 на вопрос, с которым вы связали , может быть легко обобщен на любое количество столбцов.

Вот небольшой примерный набор данных для тестирования, но я сделаю второй блок кода общим, чтобы он также работал для вашего DataFrame, если его имя равно group1.

* 1007. *
    column 1    column 2    column 3
0   1           2           3
1   1           2           4
2   1           2           3
3   1           2           5
4   1           2           3
5   1           2           4
group1['first such row'] = group1.groupby(list(group1.columns))[group1.columns[0]
                                                               ].transform('idxmin')    
group1
    column 1    column 2    column 3    first such row
0   1           2           3           0
1   1           2           4           1
2   1           2           3           0
3   1           2           5           3
4   1           2           3           0
5   1           2           4           1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...