У меня есть набор данных с факторными, логическими и числовыми значениями, и мне было интересно, могу ли я создать корреляционную матрицу с этим:
df
Country Year Log1 Num1 Log2 ....
A 1995 TRUE 0.5 FALSE
A 1996 FALSE 1.5 FALSE
B 1999 FALSE 3.7 TRUE
C 1999 TRUE -1.5 TRUE
...
, в то время как страна (и год?) Является факторным значением, LOG1 & LOG2 являются логическими значениями, а Num1 является числовым. Есть ли способ расчета коэффициентов корреляции для всех значений? Необходимо ли присваивать число факторным значениям (например, Страна A = 1, B = 2 и т. Д. c)? И должен ли я сделать это вручную или есть хороший пакет для этого? В конце я хотел бы получить таблицу корреляции, такую как:
Country Year LOG1 Num1 LOG2
Country 1.00000000 0.03892847 NA NA NA
Year 0.03892847 1.00000000 NA NA NA
LOG1 NA NA 1 NA NA
NUM1 NA NA NA 1 NA
LOG2 NA NA NA NA 1
Конечно, без NA и с правильными значениями. Есть идеи? Я знаю, что стандартным способом является correlation <- cor(df)
или даже correlation <- cor(df[sapply(df,is.numeric)], use='everything')
СПАСИБО!