GridSearchCV бесконечно работает на ноутбуке Jupyter - PullRequest
0 голосов
/ 06 мая 2019

Я пытаюсь запустить Grid Search с машиной опорных векторов, но это занимает вечность. Мой набор данных довольно большой (около 200 000 строк и 35 столбцов). Ранее я запускал подобный код несколько раз, но с ядром rbf, и каждая попытка заняла около 30 минут. Теперь я позволил ему работать в течение нескольких часов, но я не получил никакого полезного вывода, и он кажется замороженным.

Я работаю на ноутбуке Jupyter, python 3.7, macOS.

Я уже пытался закрыть все остальные открытые вкладки, перезапустить Anaconda и перезагрузить свой ноутбук, но это не помогает. Я посмотрел на свой монитор активности, и он говорит, что я использую только около 6 из 8 ГБ.

* обновление: сейчас я попытался запустить его в Spyder, но он все еще работает вечно. Я также пробовал разные значения C, но, похоже, застрял при C = 10.

Это мой код:


tuned_parameters_lin = [{'kernel': ['linear'],
                     'C': [10]}]

clf_lin_dv = GridSearchCV(svm.SVC(cache_size = 400), tuned_parameters_lin, cv=3,
                       scoring = 'accuracy', n_jobs = -1, verbose = 5)
clf_lin_dv.fit(X_train_dv, y_train_dv)


ВЫВОД: Подгонка 3 сгибов для каждого из 3 кандидатов, всего 9 подгонок

[CV] C = 10, ядро ​​= линейное ..................................... .....

[CV] C = 10, ядро ​​= линейное ..................................... .....

[CV] C = 10, ядро ​​= линейное ..................................... .....

Я жду каких-либо результатов точности, но ничего не появляется.

Кто-нибудь знает, что здесь происходит не так?

Заранее спасибо!

...