data(iris)
iris$Species<-NULL
cor(iris)
и получите кор.матрица
Sepal.Length Sepal.Width Petal.Length Petal.Width
Sepal.Length 1.0000000 -0.1175698 0.8717538 0.8179411
Sepal.Width -0.1175698 1.0000000 -0.4284401 -0.3661259
Petal.Length 0.8717538 -0.4284401 1.0000000 0.9628654
Petal.Width 0.8179411 -0.3661259 0.9628654 1.0000000
давайте получим описательную статистику
library(psych)
describe(iris)
и результаты
vars n mean sd median trimmed mad min max range skew kurtosis se
Sepal.Length 1 150 5.84 0.83 5.80 5.81 1.04 4.3 7.9 3.6 0.31 -0.61 0.07
Sepal.Width 2 150 3.06 0.44 3.00 3.04 0.44 2.0 4.4 2.4 0.31 0.14 0.04
Petal.Length 3 150 3.76 1.77 4.35 3.76 1.85 1.0 6.9 5.9 -0.27 -1.42 0.14
Petal.Width 4 150 1.20 0.76 1.30 1.18 1.04 0.1 2.5 2.4 -0.10 -1.36 0.06
Там много статик, но нам нужны только средние значения и сд
Итак, вопрос.Если у нас есть корреляция между переменными, и мы знаем среднее и SD этих переменных, как преобразовать кор.матрица к фрейму данных.Понятно, что, скорее всего, значения во фрейме данных будут отличаться от реальных.