Я использую библиотеку Scikit и хочу обучить свою модель с помощью одноклассного алгоритма SVM для обнаружения аномалий.
Я загружаю свой набор данных в массив numpy, а затем обучаю мою модель этому. Проблема показывает, когда я использую функцию прогнозирования в самом наборе данных поезда. Имеет 100% ошибку.
вот часть моего набора данных:
0 14512369 11697257 7097 12638966 0 47165 45812 4824152 4257525170 1822262282
0 14512369 11697257 7097 12638966 0 47165 45812 4824152 918662578 1822262282
0 14512369 11697257 7097 12638966 0 47165 45812 4824152 244034994 1822262282
import numpy as np
from sklearn import svm
data=np.loadtxt("f.txt")
clf = svm.OneClassSVM(nu=0.1, kernel="rbf", gamma=0.1)
clf.fit(data)
clf.predict(data)
после выполнения кода выше я получаю массив -1, в то время как я ожидал, что массив в основном +1.
Так в чем проблема? мой набор данных или параметры SVM или что-нибудь еще?