sklearn GridSearchCV завис на 20 часов на xgboost - PullRequest
0 голосов
/ 31 января 2020

Настройка:

Windows 10 самое последнее обновление

Самое последнее обновление Anaconda

Все пакеты scikit0.20.2 (другие последние обновления)

Intel Core i7-8650U 4 ядра

16 ГБ. Я попытался использовать GridSearchCV, чтобы определить лучшие параметры для моего xgboost, это код, который я запускаю.

model = xgb.XGBClassifier()
param_dist = {"max_depth": [10,30,50],
              "min_child_weight" : [1,3,6],
              "n_estimators": [200],
              "learning_rate": [0.05, 0.1,0.16],}
grid_search = GridSearchCV(model, param_grid=param_dist, cv = 3, 
                                   verbose=10, n_jobs=-1)
grid_search.fit(X_train, y_train)

grid_search.best_estimator_

model = xgb.XGBClassifier(max_depth=50, min_child_weight=1,  n_estimators=200,\
                          n_jobs=1 , verbose=1,learning_rate=0.16)
model.fit(X_train, y_train)

xgb.plot_importance(model, height=0.9)

X_test_pred = model.predict(X_test)

Это дает мне вывод:

Fitting 3 folds for each of 27 candidates, totalling 81 fits
[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.

Он работает в течение 20 часов при средней скорости процессора 85% и 70% использования памяти по отношению к ноутбуку.

Модель обычно умещается на ~ 10 секунд или меньше.

Как узнать, застряла ли она? Должен ли я просто убить процесс?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...