Это один из способов сделать это с помощью коэффициента корреляции Пирсона в Rstudio, я использовал его один раз, когда исследовал набор данных red_wine, моей целевой переменной или столбцом было качество, и я хотел узнать, как влияют на него остальные столбцы.см. рисунок ниже показывает выходные данные кода, поскольку вы видите, что синий цвет представляет положительное отношение, а красный представляет отрицательные отношения, и чем ближе значение к 1 или -1, тем темнее цвет
c <- cor(
red_wine %>%
# first we remove unwanted columns
dplyr::select(-X) %>%
dplyr::select(-rating) %>%
mutate(
# now we translate quality to a number
quality = as.numeric(quality)
)
)
corrplot(c, method = "color", type = "lower", addCoef.col = "gray", title = "Red Wine Variables Correlations", mar=c(0,0,1,0), tl.cex = 0.7, tl.col = "black", number.cex = 0.9)