Может ли градиент непрерывных предсказанных и эталонных переменных что-либо значить? - PullRequest
0 голосов
/ 09 апреля 2019

Я сделал модель Random-Forest с R для прогнозирования непрерывной целевой переменной и только что столкнулся с проблемой с моими клиентами.Я пытался сказать им, что RMSE - это хороший способ понять, насколько хороша моя модель, но они просят меня дать некоторые «точные» значения, такие как проценты, чтобы облегчить их понимание.

Итак, у меня есть вектор непрерывных предсказанных значений и непрерывных фактических значений из моего тренировочного набора.я попытался сделать следующее:

  1. Вместо этого я получил значения MAE из двух значений, но они отказались принять MAE (так как это был не тот ответ, который они хотели, как **% точности).

  2. Я сгенерировал корреляцию с двумя, получил 0,80, и им это тоже не понравилось.

  3. Я пытался факторизовать предсказанные значения, ноне было никакого способа оценить мою прогнозируемую величину, и моя точность сгенерированного фактора была чуть более 45%.Никоим образом они не примут это.

Итак,

summary(lm(prediction~MAINDATA5_TEST_18FW$WEEK-1))

Call:
lm(formula = prediction ~ as.numeric(as.character(MAINDATA5_TEST_18FW$PLCWEEK)) - 
    1)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.8077 -1.1036  0.3121  1.6788  7.0615 

Coefficients:
                                                      Estimate Std. Error t value Pr(>|t|)    
as.numeric(as.character(MAINDATA5_TEST_18FW$PLCWEEK)) 1.066786   0.006516   163.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.168 on 460 degrees of freedom
Multiple R-squared:  0.9831,    Adjusted R-squared:  0.9831 
F-statistic: 2.68e+04 on 1 and 460 DF,  p-value: < 2.2e-16

Я попробовал формулу lm (), чтобы сделать больше чисел, а также сказал им R-квадрат между предсказаннымии фактическое значение намного выше 0,98, что довольно высоко.Этого было недостаточно, чтобы сделать их счастливыми (опять же, они одержимы% s).

что привлекло мое внимание - это градиент, 1.066786.Мне было интересно, что, может быть, я могу сказать, что прогнозируемое значение модели примерно на 6,7% выше, чем фактическое значение в среднем.Достаточно ли разумна эта интерпретация?Если все это чепуха, то я буду очень рад получить некоторые предложения.Спасибо ..

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...