Какую модель прогнозирования следует использовать для прогнозирования списка колледжей для студента - PullRequest
0 голосов
/ 17 июня 2019

У меня есть набор данных об обучении, содержащий названия колледжей, звания студентов, филиалы, учебные заведения.Какую модель прогнозирования я должен использовать, чтобы предсказать список колледжей, в которые студент будет зачислен в соответствии с его рангом, окончанием колледжа и филиалом?

Я новичок в машинном обучении.

Я ожидаювыходные данные для отображения списка колледжей, в которые может быть зачислен студент, вместо отображения, выделен ли студент студенту.

Ответы [ 2 ]

0 голосов
/ 17 июня 2019

Это проблема мультиклассовой классификации.Если вы новичок, я предлагаю использовать древовидные модели, такие как классификатор случайных лесов (https://scikit -learn.org / stable / modules / generate / sklearn.ensemble.RandomForestClassifier.html ) или попробовать Xgboost, если выне получают достаточно хороших результатов от случайного леса.Они просты в использовании и хорошо справляются с задачами многоклассовой классификации.Они также легко дадут вам важность функций, которые помогут вам объяснить и вашу модель.

0 голосов
/ 17 июня 2019

Ваша проблема может рассматриваться как проблема классификации нескольких классов, где каждый колледж становится классом. Вы можете использовать простую модель случайного леса и прогнозировать вероятности класса для каждого учащегося. Поскольку вы используете вероятности, модель вернет список колледжей вместе с вероятностью. Установите порог вероятности и возьмите колледж выше этого порога в качестве результата.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...