Какое лучшее решение для вычисления корреляции между моими функциями и целевой переменной ??Мой фрейм данных имеет 1000 строк и 40 000 столбцов ...
Пример:
df = pd.DataFrame([[1, 2, 4 ,6], [1, 3, 4, 7], [4, 6, 8, 12], [5, 3, 2 ,10]], columns=['Feature1', 'Feature2','Feature3','Target'])
Этот код работает нормально, но он слишком длинный на моем фрейме данных ... Мне нужен только последний столбецматрицы корреляции: корреляция с целью (не попарная корреляция признаков).
corr_matrix=df.corr()
corr_matrix["Target"].sort_values(ascending=False)
Функция np.corcoeff () работает с массивом, но можно ли исключить корреляцию попарных функций?