У меня есть данные, как показано ниже
df.head ()
name location duration month status
aim bgy 12 active
terra pm 3 inactive
jerry bgy 23 inactive
finn dm 8 active
pearl bgy 21 active
doe pm 9 inactive
pearl pm 11 inactive
почти 2000 точек данных, которые у меня есть, и около 6 уникальных названий местоположений.мне нужно построить / обучить модель прогнозирования, в которой дано любое имя, местоположение, текущая информация о продолжительности, он должен прогнозировать статус (активный / неактивный) с вероятностью%, поэтому, если входные данные для этой модели
name location duration month
jim bgy 6
tim pm 9
sara bgy 12
я должен получить результаты как
name location duration month status active_probability
jim bgy 6 active 0.9
tim pm 9 inactive 0.0
sara bgy 12 active 0.8