Я пытаюсь выяснить, почему моя модель так плохо работает с невидимыми данными. Набор данных о банке, который начинает кампанию и хочет выяснить, станет ли вызываемый абонент клиентом или нет. Поэтому я попробовал некоторые преобразования функций, в том числе OneHot и Dummyvariable, после чего я ищу оптимальные гиперпараметры с помощью случайного поиска и оцениваю результат с помощью балла F1. Я знаю, что там нет никакой особенности разработки, потому что это только первый проект. Но лучший результат модели по данным испытаний составил около 49%. Это довольно плохо, и я не могу понять, почему. Очень удивительно, что цель помечается как особенность после подгонки к конвейеру и поиска «важности»
https://colab.research.google.com/drive/1IlGJ2aItwFCMQ8oVsQHw6-5mlXP_17Gc
Greeting Mambula