Имея только очень ограниченные знания о моделировании, я пытаюсь сделать модели из независимых непрерывных переменных PARAM_*
, чтобы описать каждую из дискретных зависимых Grp_*
.
Затем была бы цель сравнить ихмодели на новых данных для их классификации.
> my_training_df
GRPS PARAM_1 PARAM_2 PARAM_3 PARAM_4
Grp_A 2.20 -2.17 4.53 -0.39
Grp_A 0.30 3.29 3.98 3.38
Grp_A -2.33 -0.43 3.45 1.64
Grp_A 4.59 -1.92 0.83 -0.87
Grp_B -2.85 1.52 1.61 -0.28
Grp_B -0.31 2.47 -2.23 -2.47
Grp_B 4.03 0.49 -2.16 -0.42
Grp_C 0.50 2.04 1.03 1.33
Grp_C 1.80 4.40 2.20 2.12
Grp_C 4.19 4.55 0.12 -2.91
Grp_C 3.69 -1.88 1.56 2.73
Grp_C -1.02 3.37 4.95 2.96
Я планировал использовать метод множественной линейной регрессии (казалось, что его проще всего начать), но можно ли создать фиктивные переменные для преобразования зависимых переменная в непрерывную.
Я не понимаю, как модель могла бы работать:
GRPS = a + b1*PARAM_1 + b2*PARAM_2 + b3*PARAM_3 + b4*PARAM_4
Какой метод мне следует использовать (возможно, с R)?