У меня проблема с регрессией в python. Мой входной набор данных выглядит следующим образом:
x = Средство, отклонения, дисперсии, varianceOfVariance
y = ходить, медленно, бегать, удерживать
X-объекты состоят из значений, и Y двоично помечен в одной из 4 категорий. Так что это может быть или ходьба или медленный или бег или удержание. data.head () выглядит следующим образом.
Я могу разбить pd-кадр данных в X_train, X_test, y_train, y_test с train_test_split ( ).
Я хочу создать регрессор (например, SVM или линейный регрессор), который дает прогнозы для этих тегов в таком формате: 70% ходьбы, 25% медленной, 0% бега, 5% удержания ,
Это должно быть вероятностно c, я пробовал с классификатором и объединил теги в одну переменную, но теперь я пытаюсь с вероятностью c шансов.
Возможно ли это с библиотекой sklearn, если да, то как? Я не могу понять это.