масштабирование данных замедляет работу sklearn svm - PullRequest
0 голосов
/ 01 января 2019

Я провожу некоторые эксперименты со sklearn.svm.SVC с линейным ядром.Я генерирую данные примерно так:

X[:50,:2] = (np.random.randn(50, 2)+[2,2])*scale
X[50:,:2] = (np.random.randn(50, 2))*scale
y = np.array([0]*50 + [1]*50)

Я заметил, что если я масштабирую точки данных в 1000 раз, то обучение занимает гораздо больше времени (фактически я никогда не видел, чтобы оно заканчивало обучение).Почему масштабирование влияет на время тренировки?

На самом деле, когда я масштабирую его всего на 10, оно заканчивает тренировку через некоторое время, но точность очень низкая (она предсказывает, что все будет одним и тем же).Это почти кажется, что SVM не использует смещения или что-то.Но я уверен, что это так ...

...