Я работаю над проектом в datadriven (проект просто для развлечения, а не для денежного приза), цель проекта - предсказать бинарный класс, который представляет, есть ли у пациента болезнь сердца.
соревнование использует функцию logloss для измерения производительности алгоритма.
мой фактический лучший результат - 0,31132.
, чтобы достичь моего фактического результата, я проверил, все ли переменные имеют соответствующий тип после этого.преобразовал объектные переменные в фиктивные и целочисленные переменные, такие как пол, например, в категорию, я использовал griddsearch с помощью пиплайна (масштабируя мои данные и используя логистическую регрессию), а с параметром cv = 5 я действительно не знаю, как улучшить мой показатель потери логов, такЯ прошу некоторые инструкции, и каковы лучшие альтернативы, чтобы предсказать вероятность, кроме логистической регрессии, которую я должен попробовать.