Интерпретировать ggscatter и cor.test результат - PullRequest
0 голосов
/ 30 августа 2018

Мне нужно правильно интерпретировать результаты моих корреляционных тестов и проверить, соответствуют ли они результатам двоичной классификации, выполненной на более позднем этапе.

Я пытаюсь проверить корреляцию между двумя переменными (из домена НЛП), и ниже приведен мой код R.

displaydata = data.frame(game = as.character(Star_Ratings[,1]), mean_scores = as.matrix(universal.data$score), reviews = as.matrix(Star_Ratings[,2])) # for visualization only.

# Visualization
cordata = data.frame(x = displaydata$mean_scores, y = displaydata$reviews)
ggscatter(cordata, x = "x", y = "y",
         add = "reg.line", conf.int = TRUE,
         cor.coef = TRUE, cor.method = "pearson",
         xlab = "points", ylab = "out of 5 stars")

enter image description here

# Correlation
x <- displaydata[["mean_scores"]]
y <- displaydata[["reviews"]]
result <- cor.test(x,y,method = "pearson")
result
Pearson's product-moment correlation

data:  x and y
t = 0.8101, df = 48, p-value = 0.4219
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1676306  0.3821309
sample estimates:
    cor
0.116136
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...