Мои данные в следующем формате
NAME SALARY DEPT rank1
Dan 623.3 HR 1
Dan 515.2 HR 0
Dan 611 HR 1
Dan 729 HR 2
Rick 843.25 IT 2
Rick 578 IT 0
Rick 632.8 IT 1
Rick 722.5 IT 1
Я хочу использовать мультиклассовую модель классификации для прогнозирования ранга1. SALARY и DEPT - мои независимые переменные. Большинство алгоритмов оценивают, используя класс, который имел наибольшую вероятность относительно контрольного уровня. Но здесь мне нужна вероятность всех уровней. Мне также нужно построить модель по ИМЯ, так что каждое отдельное ИМЯ будет иметь свои собственные коэффициенты после обучения модели. Я согласен с использованием Логистической регрессии, KNN, Наивного Байеса или любого другого алгоритма, который вы предлагаете. Мой результат должен дать вероятность каждого ранга1 для данных скоринга. Когда я получаю новые данные (того же формата, что и мои данные тренировок), я должен получить результат в следующем формате
NAME SALARY DEPT rank1_0 rank1_1 rank1_2
Dan 711 HR 0.25 0.6 0.15
Rick 819 IT 0.2 0.3 0.5
Dan 743 HR 0.1 0.2 0.7
Rick 688 IT 0.3 0.3 0.4
столбцы rank1_0, rank1_1 и rank1_2 имеют вероятность классов 0,1 и 2 соответственно.
Спасибо за помощь!