Еще один более прямой способ проверить, дублируются ли два числовых столбца друг с другом, - это проверить матрицу корреляции, которая проверяет все пары столбцов. Вот код:
import pandas as pd
df = pd.DataFrame([[1,0,1,1], [2,0,2,2]], columns=['A', 'B', 'C', 'D'])
# compute the correlation matrix
cm = df.corr()
cm
![enter image description here](https://i.stack.imgur.com/Uv7G7.png)
Здесь показана матрица корреляции всех столбцов друг с другом (включая самого себя). Если столбец равен 1: 1 с другим столбцом, то значение равно 1,0.
Чтобы найти все столбцы, которые являются дубликатами A, тогда:
cm['A']
A 1.0
B NaN
C 1.0
D 1.0
Если у вас есть категориальные (строковые объекты), а не числовые, вы можете создать таблицу взаимной корреляции.
Надеюсь, это поможет!