использование корреляции для валидации тренировочных и тестовых данных линейных моделей - PullRequest
0 голосов
/ 30 января 2019

Мой вопрос не нуждается в каких-либо данных в качестве примера, поскольку это теоретический вопрос.

Я создал несколько линейных моделей, используя 80% своих данных, и я проверяю предсказательную силу моделей на оставшихся 20%из моих данных.Один из методов проверки точности моделей состоит в том, чтобы посмотреть на среднее отношение прогнозируемого к фактическому, то есть

predicted <- predict (model.1, testData)  # predict on test data
compare <- cbind (actual=testData$Var1, predicted)  # combine actual and predicted
mean (apply(compare, 1, min)/apply(compare, 1, max)) 

Мои результаты обычно говорят, что мои модели точны на 70 - 85%, но графики данных показывают многорассеяния.Поэтому я могу вместо этого использовать корреляции предсказанного и фактического?то есть

compare2=as.data.frame(compare)
cor.test(compare2$actual, compare2$predicted)

Я не могу найти какой-либо совет по этому поводу в Интернете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...