Мой вопрос не нуждается в каких-либо данных в качестве примера, поскольку это теоретический вопрос.
Я создал несколько линейных моделей, используя 80% своих данных, и я проверяю предсказательную силу моделей на оставшихся 20%из моих данных.Один из методов проверки точности моделей состоит в том, чтобы посмотреть на среднее отношение прогнозируемого к фактическому, то есть
predicted <- predict (model.1, testData) # predict on test data
compare <- cbind (actual=testData$Var1, predicted) # combine actual and predicted
mean (apply(compare, 1, min)/apply(compare, 1, max))
Мои результаты обычно говорят, что мои модели точны на 70 - 85%, но графики данных показывают многорассеяния.Поэтому я могу вместо этого использовать корреляции предсказанного и фактического?то есть
compare2=as.data.frame(compare)
cor.test(compare2$actual, compare2$predicted)
Я не могу найти какой-либо совет по этому поводу в Интернете.