У меня есть набор данных, в котором количество строк почти одинаково, то есть они имеют одинаковые значения для всех полей, кроме столбца C.
A B C D ..... Z
0 50 'Ohio' 'Rep' 3 45
1 50 'Ohio' 'Dem' 3 45
2 40 'Kansas' 'Dem' 34 1
3 30 'Kansas' 'Dem' 45 2
4 55 'Texas' 'Rep' 2 7
....
38 55 'Texas' 'Dem' 2 7
Я хотел бы идентифицировать все строки, которые идентичны, кромедля столбца C, но внутри столбца CI нужно только найти комбинации «Rep» и «Dem».Поэтому я не хочу, чтобы 2 одинаковые строки со столбцом C, например, «Rep» и «Rep».
A B C D ......Z
0 50 'Ohio' 'Rep' 3 45
1 50 'Ohio' 'Dem' 3 45
4 55 'Texas' 'Rep' 2 7
38 55 'Texas' 'Dem' 2 7
Я использовал дублированный метод для всех столбцов (кроме C), и это обеспечивает всестроки, которые идентичны.Однако это не приводит к дублированию, когда каждая дублированная строка с «Rep» имеет ровно одну дублированную строку с «Dem».