Мне нужно правильно интерпретировать результаты моих корреляционных тестов и проверить, соответствуют ли они результатам двоичной классификации, выполненной на более позднем этапе.
Я пытаюсь проверить корреляцию между двумя переменными (из домена НЛП), и ниже приведен мой код R.
displaydata = data.frame(game = as.character(Star_Ratings[,1]), mean_scores = as.matrix(universal.data$score), reviews = as.matrix(Star_Ratings[,2])) # for visualization only.
# Visualization
cordata = data.frame(x = displaydata$mean_scores, y = displaydata$reviews)
ggscatter(cordata, x = "x", y = "y",
add = "reg.line", conf.int = TRUE,
cor.coef = TRUE, cor.method = "pearson",
xlab = "points", ylab = "out of 5 stars")
![enter image description here](https://i.stack.imgur.com/wPoNS.png)
# Correlation
x <- displaydata[["mean_scores"]]
y <- displaydata[["reviews"]]
result <- cor.test(x,y,method = "pearson")
result
Pearson's product-moment correlation
data: x and y
t = 0.8101, df = 48, p-value = 0.4219
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1676306 0.3821309
sample estimates:
cor
0.116136