Попытка обрезать 500 столбцов, в которых есть много фиктивных переменных-R - PullRequest
0 голосов
/ 08 марта 2020

У меня есть набор данных с 500 столбцами, и для многих из них требуются фиктивные переменные, чтобы избежать линейности (ie: уровни дохода, которые составляют до 100%). Я пытаюсь разработать модель регрессии. Мне интересно, есть ли способ избежать ручного обхода столбцов и добавления макетов? Любые мысли будут оценены. Я пытаюсь определить около 20 переменных, которые являются значительными. Спасибо

1 Ответ

0 голосов
/ 08 марта 2020

Я бы предложил использовать каретку :: dummyVars

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...