Я пытаюсь запустить Grid Search с машиной опорных векторов, но это занимает вечность. Мой набор данных довольно большой (около 200 000 строк и 35 столбцов). Ранее я запускал подобный код несколько раз, но с ядром rbf, и каждая попытка заняла около 30 минут. Теперь я позволил ему работать в течение нескольких часов, но я не получил никакого полезного вывода, и он кажется замороженным.
Я работаю на ноутбуке Jupyter, python 3.7, macOS.
Я уже пытался закрыть все остальные открытые вкладки, перезапустить Anaconda и перезагрузить свой ноутбук, но это не помогает. Я посмотрел на свой монитор активности, и он говорит, что я использую только около 6 из 8 ГБ.
* обновление: сейчас я попытался запустить его в Spyder, но он все еще работает вечно. Я также пробовал разные значения C, но, похоже, застрял при C = 10.
Это мой код:
tuned_parameters_lin = [{'kernel': ['linear'],
'C': [10]}]
clf_lin_dv = GridSearchCV(svm.SVC(cache_size = 400), tuned_parameters_lin, cv=3,
scoring = 'accuracy', n_jobs = -1, verbose = 5)
clf_lin_dv.fit(X_train_dv, y_train_dv)
ВЫВОД:
Подгонка 3 сгибов для каждого из 3 кандидатов, всего 9 подгонок
[CV] C = 10, ядро = линейное ..................................... .....
[CV] C = 10, ядро = линейное ..................................... .....
[CV] C = 10, ядро = линейное ..................................... .....
Я жду каких-либо результатов точности, но ничего не появляется.
Кто-нибудь знает, что здесь происходит не так?
Заранее спасибо!