К сожалению, большая часть литературы останавливается на том, что включает VIF, выполняя обратную проблему множественной регрессии в Python.
, есть ли научная литература c, или тетрадь kaggle, которая описывает, когда и как обрабатывать VIF при выполнении обратной ликвидации? Если вы будете следовать стандартной литературе, у вас в конечном итоге будут статистически значимые переменные с высоким R², но сильно коррелированные переменные все еще будут включены (высокий VIF).
Какой здесь подход и процедура? Первое подмножество потенциальной комбинации с низким VIF? Любая рекомендация для литературы?
Спасибо.
С уважением