Я анализирую некоторые данные. У меня есть 7 функций и хочу предсказать у. Я выполнил прямой отбор и откат назад, но обе модели дают очень плохие результаты. Я сгенерировал больше функций путем преобразования переменных x (x ^ 2, x ^ 3, 1 / x, x ^ (1/2)), чтобы увидеть, улучшатся ли результаты (всего 28 переменных). После запуска кода I получить даже худшие результаты, независимо от того, что я делаю (настроить уровень значимости, изменить критерии исключения), я всегда получаю перехват в качестве функции регрессии в прямом выборе и всех переменных (нормальных и преобразованных) в обратном исключении.
У вас есть идея, почему это происходит? Насколько я понимаю, в случае прямого выбора алгоритм проверяет p-значения каждой переменной и добавляет лучшее. таким образом, если в первом случае (без преобразованных переменных) x1 находится в функции регрессии, во втором случае (с преобразованными переменными) x1 также должен быть в функции регрессии, а не просто как перехват.
Заранее спасибо.