Случайный лес плохой результат - PullRequest
0 голосов
/ 13 февраля 2020

Я пытаюсь выяснить, почему моя модель так плохо работает с невидимыми данными. Набор данных о банке, который начинает кампанию и хочет выяснить, станет ли вызываемый абонент клиентом или нет. Поэтому я попробовал некоторые преобразования функций, в том числе OneHot и Dummyvariable, после чего я ищу оптимальные гиперпараметры с помощью случайного поиска и оцениваю результат с помощью балла F1. Я знаю, что там нет никакой особенности разработки, потому что это только первый проект. Но лучший результат модели по данным испытаний составил около 49%. Это довольно плохо, и я не могу понять, почему. Очень удивительно, что цель помечается как особенность после подгонки к конвейеру и поиска «важности»

https://colab.research.google.com/drive/1IlGJ2aItwFCMQ8oVsQHw6-5mlXP_17Gc

Greeting Mambula

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...