ошибка неверного значения в мультиклассовой классификации - PullRequest
0 голосов
/ 09 января 2019

Я делаю мультиклассовую классификацию, форма данных (299,6) и форма меток (299,5). Вот образец данных, которые у меня есть

[[0.004873972,0.069813839,-0.470500136,2.285885634,0.5335,0.052915143],
[0.001698812,0.041216647,-0.01333925,2.507806584,0.2332,0.123463255],
[0.005954432,0.077164967,4.749752766,26.45721079,0.1663,0.186452725],
[0.001792197,0.042334345,-0.176201652,1.9656153,0.4001,0.087055596],
[0.001966929,0.044350068,0.182059972,1.610369693,0.55,0.29675874]]

Вот метки для этих меток данных для данных [[1,0,0,0,0],[0,0,0,1,0],[0,0,0,1,0],[0,0,1,0,0],[0,1,0,0,0]], хранящихся в CSV-файле.

Я пробовал svm и логистическую регрессию, но выдает ошибку ValueError: неправильная форма ввода (299, 5), ошибка в метках, но как я могу решить эту проблему.

[sample dataset][1]
  [1]: https://i.stack.imgur.com/Wncqy.png

1 Ответ

0 голосов
/ 09 января 2019

Вы можете запустить его как стандартную задачу классификации, в которой вы преобразуете горячее окончание в метки и обучаете классификатор SVM, см. Пример кода:

import numpy as np
from sklearn.svm import SVC

data = np.array([[0.004873972,0.069813839,-0.470500136,2.285885634,0.5335,0.052915143],
                 [0.001698812,0.041216647,-0.01333925,2.507806584,0.2332,0.123463255],
                 [0.005954432,0.077164967,4.749752766,26.45721079,0.1663,0.186452725],
                 [0.001792197,0.042334345,-0.176201652,1.9656153,0.4001,0.087055596],
                 [0.001966929,0.044350068,0.182059972,1.610369693,0.55,0.29675874]])
outputs = np.array([[1,0,0,0,0],[0,0,0,1,0],[0,0,0,1,0],[0,0,1,0,0],[0,1,0,0,0]])
labels = np.argmax(outputs, axis=0)

clf = SVC()
clf.fit(data, labels)
print(clf.score(data, labels))
# 0.6

Для настройки параметров взгляните на Гиперпараметр Настройка случайного леса в Python и Сравнение рандомизированного поиска и поиска по сетке для оценки гиперпараметра

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...