Настройка:
Windows 10 самое последнее обновление
Самое последнее обновление Anaconda
Все пакеты scikit0.20.2 (другие последние обновления)
Intel Core i7-8650U 4 ядра
16 ГБ. Я попытался использовать GridSearchCV, чтобы определить лучшие параметры для моего xgboost, это код, который я запускаю.
model = xgb.XGBClassifier()
param_dist = {"max_depth": [10,30,50],
"min_child_weight" : [1,3,6],
"n_estimators": [200],
"learning_rate": [0.05, 0.1,0.16],}
grid_search = GridSearchCV(model, param_grid=param_dist, cv = 3,
verbose=10, n_jobs=-1)
grid_search.fit(X_train, y_train)
grid_search.best_estimator_
model = xgb.XGBClassifier(max_depth=50, min_child_weight=1, n_estimators=200,\
n_jobs=1 , verbose=1,learning_rate=0.16)
model.fit(X_train, y_train)
xgb.plot_importance(model, height=0.9)
X_test_pred = model.predict(X_test)
Это дает мне вывод:
Fitting 3 folds for each of 27 candidates, totalling 81 fits
[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
Он работает в течение 20 часов при средней скорости процессора 85% и 70% использования памяти по отношению к ноутбуку.
Модель обычно умещается на ~ 10 секунд или меньше.
Как узнать, застряла ли она? Должен ли я просто убить процесс?