склеар детерминированность c регрессия с несколькими тегами - PullRequest
0 голосов
/ 18 марта 2020

У меня проблема с регрессией в python. Мой входной набор данных выглядит следующим образом:

x = Средство, отклонения, дисперсии, varianceOfVariance

y = ходить, медленно, бегать, удерживать

X-объекты состоят из значений, и Y двоично помечен в одной из 4 категорий. Так что это может быть или ходьба или медленный или бег или удержание. data.head () выглядит следующим образом.

enter image description here

Я могу разбить pd-кадр данных в X_train, X_test, y_train, y_test с train_test_split ( ).

Я хочу создать регрессор (например, SVM или линейный регрессор), который дает прогнозы для этих тегов в таком формате: 70% ходьбы, 25% медленной, 0% бега, 5% удержания ,

Это должно быть вероятностно c, я пробовал с классификатором и объединил теги в одну переменную, но теперь я пытаюсь с вероятностью c шансов.

Возможно ли это с библиотекой sklearn, если да, то как? Я не могу понять это.

1 Ответ

0 голосов
/ 18 марта 2020

Классификаторы уже вероятностны c - вы можете получить вероятности, а не только класс наибольшей вероятности. используя предикат_проба:

clf.fit(X_train, y_train)
score = clf.score(X_test, y_test)
probs = clf.predict_proba(X_test)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...