Я знаю, что этот вопрос может быть странным. Дело в том, что у меня есть проект, позволяющий мне использовать только линейную регрессию ... И я ладья ie. Данные для этой модели очень плохие, поэтому прежде чем использовать перекрестную проверку с помощью Lasso. Я получаю оценку R2 следующим образом:
[ 0.56585033 0.62250232 0.25906073 0.46078607 -0.11444177 0.52783587
0.52068463 0.73543617 0.56687063 0.18193339]
Как видите, есть один -0,11 и один 0,18, которые очень низкие. Я хочу посмотреть, что с ними случилось. Причина в том, что даже с Лассо следующее - это лучшее, что я могу получить, не имея 0 и большой дисперсии ...
[0.33662216 0.50566121 0.27028283 0.47558253 0.4023398 0.26292917
0.48559272 0.59582206 0.53425416 0.32131172]
Кстати, есть только 150 наблюдений с 20 особенностями. Вот почему я использую Лассо.
Или, что еще я могу сделать, чтобы улучшить эту линейную регрессию?