Я пытаюсь получить модель машинного обучения, чтобы предсказать средний уровень игроков в бейсболе, основываясь на их показателях At Bats and Hits.Поскольку:
Batting Average = Hits/At Bats
Я думаю, что эти отношения будет относительно легче обнаружить.Однако, поскольку Batting Average - это число с плавающей запятой (то есть 0,300), все модели, которые я пробую, возвращают следующую ошибку:
ValueError: Unknown label type: 'continuous'
Я использую модели sklearns.Я пробовал LogisticRegression, RandomForestClassifier, LinearRegression.У них у всех одна и та же проблема.
После прочтения других сообщений StackOverflow об этой ошибке я начал делать следующее:
lab_enc = preproccessing.LabelEncoder()
y = pd.DataFrame(data=lab_enc.fit_transform(y))
, который, кажется, изменяет значения, такие как 0,227 - 136, что кажется странным длямне.Возможно, только потому, что я не совсем понимаю, что делает преобразование.Я бы, если возможно, предпочел бы просто использовать фактические средние значения Batting.
Есть ли способ получить модели, с которыми я пытался работать, при прогнозировании непрерывных значений?