Как рассчитать корреляцию между несколькими переменными, используя R - PullRequest
0 голосов
/ 19 сентября 2019

У меня есть база данных в Excel, мне нужно вычислить корреляцию между всеми переменными в моей базе данных, и после графического анализа мне нужно знать, как это сделать с использованием R i:

 M<-cor(Donn2[,-1])
> M
                          Litrage produit Rapportinjection      Format Nbre passage eau
Litrage produit                 1.0000000       0.20415852  0.27658465       0.67426686
Rapportinjection                0.2041585       1.00000000 -0.12380173       0.31795429
Format                          0.2765846      -0.12380173  1.00000000      -0.05253294
Nbre passage eau                0.6742669       0.31795429 -0.05253294       1.00000000
Pertes totales PF(%)           -0.5233907      -0.07581707 -0.52733899      -0.22555675
Pertes PF secteur 3 (eur)              NA               NA          NA               NA
Coût pertes Secteur 3 (L)       0.6742669       0.31795429 -0.05253294       1.00000000
                          Pertes totales PF(%) Pertes PF secteur 3 (eur) Coût pertes Secteur 3 (L)
Litrage produit                    -0.52339068                        NA                0.67426686
Rapportinjection                   -0.07581707                        NA                0.31795429
Format                             -0.52733899                        NA               -0.05253294
Nbre passage eau                   -0.22555675                        NA                1.00000000
Pertes totales PF(%)                1.00000000                        NA               -0.22555675
Pertes PF secteur 3 (eur)                   NA                         1                        NA
Coût pertes Secteur 3 (L)          -0.22555675                        NA                1.00000000

У меня есть какое-то значение сNA, что эта грива только в одной переменной, когда у меня есть NA

и когда я использую;

> corrplot(M, type="upper")

у меня есть coorgrame у меня что-то вроде этого:

enter image description here

почему я получаю такой результат со значением NA?

спасибо

1 Ответ

1 голос
/ 19 сентября 2019

Исключая все символьные и факторные переменные, вы можете использовать функцию cor().Вот пример использования iris набора данных

data(iris)
cor(iris[,-5])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...