создать корреляционную матрицу в r с логическими и факторными значениями - PullRequest
0 голосов
/ 12 марта 2020

У меня есть набор данных с факторными, логическими и числовыми значениями, и мне было интересно, могу ли я создать корреляционную матрицу с этим:

df
Country  Year  Log1   Num1  Log2 ....
A        1995  TRUE   0.5   FALSE
A        1996  FALSE  1.5   FALSE
B        1999  FALSE  3.7   TRUE
C        1999  TRUE   -1.5  TRUE
...

, в то время как страна (и год?) Является факторным значением, LOG1 & LOG2 являются логическими значениями, а Num1 является числовым. Есть ли способ расчета коэффициентов корреляции для всех значений? Необходимо ли присваивать число факторным значениям (например, Страна A = 1, B = 2 и т. Д. c)? И должен ли я сделать это вручную или есть хороший пакет для этого? В конце я хотел бы получить таблицу корреляции, такую ​​как:

              Country      Year    LOG1   Num1   LOG2
Country     1.00000000 0.03892847    NA    NA     NA
Year        0.03892847 1.00000000    NA    NA     NA
LOG1                NA         NA     1    NA     NA
NUM1                NA         NA    NA     1     NA
LOG2                NA         NA    NA    NA      1

Конечно, без NA и с правильными значениями. Есть идеи? Я знаю, что стандартным способом является correlation <- cor(df) или даже correlation <- cor(df[sapply(df,is.numeric)], use='everything')

СПАСИБО!

...