Расчет корреляции между ответом и определенными объяснительными переменными - PullRequest
3 голосов
/ 05 октября 2011

Я хочу создать один столбец, который позволит мне узнать корреляции для моей зависимой переменной со всеми поясняющими переменными, которые меня интересуют (все эти столбцы и многие другие хранятся в data.frame d). С помощью cor (d) я могу получить все корреляции, а с помощью cor (d $ Var1, d $ Var2) я могу получить одно число, но я хочу выяснить, как получить только столбец Var1 из матрицы, возвращаемой cor (d), поскольку я могу выбрать поясняющие переменные, которые я хочу включить.

Ответы [ 3 ]

4 голосов
/ 05 октября 2011

Функция cor на самом деле может это делать.Предположим, у нас есть:

d=data.frame(dependentVar = c(1,2,3),var1=c(-1,-2,-3),var2=c(9,0,5),junk=c(-2,-3,5))

Тогда это поможет:

cor(d[,"dependentVar"], d[,c("var1","var2")])
     var1       var2
[1,]   -1 -0.4435328

Это менее эффективно (я думаю), но вы также можете сделать это:

cor(d)["dependentVar", c("var1","var2")]

, который вычисляет полную корреляционную матрицу, а затем извлекает желаемое подмножество.

3 голосов
/ 05 октября 2011

@ DavidR является правильным, хотя R также поддерживает корреляцию между столбцами X и столбцами Y как:

cor(X, Y)

См. ?cor для получения дополнительной информации.

0 голосов
/ 08 декабря 2018
M <- round(cor(College[,-1]),2)

library('corrplot') #package corrplot

Мы можем использовать круг, квадрат, затмение также вместо числа, если нам нужны изображения вместо прямых чисел

corrplot(M, method = "number") #plot matrix

Матрица корреляции

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...