Как проверить, насколько хорошо модель линейной регрессии адаптирована к данным? - PullRequest
1 голос
/ 11 февраля 2020

У меня есть небольшой набор данных и модель, которая, согласно моим расчетам, должна очень хорошо соответствовать данным (она была рассчитана вручную, а не с помощью R), но я хочу точно проверить, насколько хорошо она подходит к данным. Так есть ли способ ввести мою модель в R (не чтобы R соответствовал модели) и проверить, насколько хорошо она соответствует данным?

Я не знаю, имеет ли это значение, но моя функция моделирования - f (x ) = -6,65х ^ 2 - 23,28х - 16,85. Мой набор данных - это всего два вектора с 7 значениями в каждом.

Если кто-то знает функцию, которая делает это, пожалуйста, помогите

1 Ответ

1 голос
/ 11 февраля 2020

Предполагая, что у вас есть данные для x и наблюдаемые значения y, вам нужно будет создать вектор, в котором хранятся все предсказанные y_hat(x), а затем использовать метри c, которую вы хотите использовать для оценки модель.

Допустим, у вас есть следующая таблица:

>>> df
   y   x
  23   5
 998  12
 121  52
  57   3

Следующим шагом будет добавление столбца с именем y_pred:

df$y_pred = (df$x * df$x) - (df$x * 23.28) - 16.85

Теперь у вас y_pred хранится в df$y_pred, поэтому все, что вам нужно сделать, это сравнить df$y с df$y_pred (вы не указали, как вы хотите это сделать).

Например, Вы можете создать точечный график df$x и df$y и нарисовать линию df$y_pred поверх него. Я рекомендую использовать ggplot для этого. В противном случае вы можете получить квадрат ошибок, выполнив df$err_squared <- (df$y - df$y_pred)^2. Чтобы получить сумму, просто попробуйте sum(df$err_squared).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...