Почему LinearSVC так плохо работает с этим набором данных? - PullRequest
0 голосов
/ 30 апреля 2019

Я только что сгенерировал набор данных, и по графику рассеяния я думаю, что эти рассеяния вполне отделимы. Но я действительно не знаю, почему Linear SVC-sklearn работал очень плохо. График разброса набора данных и результат SVC приведены ниже:

точечная диаграмма Линейный результат SVC

Код, который я использую, похож на

from sklearn.svm import LinearSVC    
svc = LinearSVC()    
model = svc.fit(X, y)

Может ли кто-нибудь помочь мне с этой проблемой? Я действительно думаю, что у SVM должен быть лучший результат.

CSV-файл набора данных находится здесь: CSV-файл данных

Первые два столбца - x и y соответственно, а третий столбец - метка данных.

1 Ответ

2 голосов
/ 30 апреля 2019

Предполагая, что ваши данные отцентрированы, установите fit_intercept на False.Вы могли бы добиться большего успеха с меньшей регуляризацией, увеличив стоимость ошибки (C=100):

svc = LinearSVC(fit_intercept=False, C=100)
...