Сравнение моделей по R2 и RMSE - PullRequest
0 голосов
/ 30 апреля 2018

Я разрабатываю модельные прогнозы, используя пакеты pls и h2o, которые приводят к двум моделям: pls.model и h2o.model. R-квадрат (квадрат корреляции Пирсона) и RMSE для каждого раунда перекрестной проверки показаны ниже: R2:

i     R2.PLS     R2.H2O
1   1 0.4415108 0.6232292
2   2 0.3754088 0.6056992
3   3 0.4267580 0.6204750
4   4 0.3505282 0.6062691
5   5 0.2870766 0.5344183
6   6 0.3858786 0.5794828
7   7 0.3449946 0.5692314
8   8 0.2974582 0.5522208
9   9 0.3446449 0.5694339
10 10 0.3987684 0.5561757

RMSE:

i  rmse.pls rmse.h2o
1   1  8.839967 40.99896
2   2  9.347349 29.94260
3   3  4.240366 14.75890
4   4 17.901563 29.89181
5   5  4.686803 66.04993
6   6 31.717909 10.28799
7   7  2.066342 32.74828
8   8 15.979214 21.05928
9   9 19.454079 10.88551
10 10 27.039400 68.27017

Я не могу объяснить, почему pls.model имеет более низкий R2, но меньшую ошибку, в то время как h2o.model имеет более высокий R2, но высокую ошибку. Я проверил график рассеяния, но никакой нелинейный рисунок не появился. Ты бы мог подумать об этом? И в этом случае какая модель должна быть лучше?

Спасибо Фыонг

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...