Я пытаюсь отфильтровать столбцы данных по их значениям корреляции.
У меня есть два кадра данных, d1 и d2. У df2 есть несколько столбцов, и я хочу выбрать только те, для которых указано значение корреляции с df1.
Я написал функцию для запуска корреляций между фреймами данных df1 и df2
threshold = 0.8
filter = df2.apply(lambda x: df1.corrwith(x)) > threshold
Затем я попытался использовать фильтр для выбора столбцов в df2
df2[df2[filter]==True]
Это не сработало, все, что я получил, это весь df2, заполненный значениями NaN, а не только столбцы со значениями корреляции выше 0,8.