Предполагая, что у вас есть данные для x
и наблюдаемые значения y
, вам нужно будет создать вектор, в котором хранятся все предсказанные y_hat(x)
, а затем использовать метри c, которую вы хотите использовать для оценки модель.
Допустим, у вас есть следующая таблица:
>>> df
y x
23 5
998 12
121 52
57 3
Следующим шагом будет добавление столбца с именем y_pred
:
df$y_pred = (df$x * df$x) - (df$x * 23.28) - 16.85
Теперь у вас y_pred
хранится в df$y_pred
, поэтому все, что вам нужно сделать, это сравнить df$y
с df$y_pred
(вы не указали, как вы хотите это сделать).
Например, Вы можете создать точечный график df$x
и df$y
и нарисовать линию df$y_pred
поверх него. Я рекомендую использовать ggplot
для этого. В противном случае вы можете получить квадрат ошибок, выполнив df$err_squared <- (df$y - df$y_pred)^2
. Чтобы получить сумму, просто попробуйте sum(df$err_squared)
.