Моделирование множественной линейной регрессии с дискретными зависимыми и непрерывными независимыми переменными - PullRequest
0 голосов
/ 06 июня 2018

Имея только очень ограниченные знания о моделировании, я пытаюсь сделать модели из независимых непрерывных переменных PARAM_*, чтобы описать каждую из дискретных зависимых Grp_*.

Затем была бы цель сравнить ихмодели на новых данных для их классификации.

> my_training_df
 GRPS PARAM_1   PARAM_2   PARAM_3   PARAM_4
Grp_A    2.20     -2.17      4.53     -0.39
Grp_A    0.30      3.29      3.98      3.38
Grp_A   -2.33     -0.43      3.45      1.64
Grp_A    4.59     -1.92      0.83     -0.87
Grp_B   -2.85      1.52      1.61     -0.28
Grp_B   -0.31      2.47     -2.23     -2.47
Grp_B    4.03      0.49     -2.16     -0.42
Grp_C    0.50      2.04      1.03      1.33
Grp_C    1.80      4.40      2.20      2.12
Grp_C    4.19      4.55      0.12     -2.91
Grp_C    3.69     -1.88      1.56      2.73
Grp_C   -1.02      3.37      4.95      2.96

Я планировал использовать метод множественной линейной регрессии (казалось, что его проще всего начать), но можно ли создать фиктивные переменные для преобразования зависимых переменная в непрерывную.

Я не понимаю, как модель могла бы работать:

GRPS = a + b1*PARAM_1 + b2*PARAM_2 + b3*PARAM_3 + b4*PARAM_4 

Какой метод мне следует использовать (возможно, с R)?

1 Ответ

0 голосов
/ 08 июня 2018

Логистическая регрессия - ответ, я думаю.Однако как выбрать, как разбить фрейм данных на набор для обучения и тестирования (из качественного и количественного POV)?

...