Необъяснимая ошибка времени выполнения с RandomizedSearchCV - PullRequest
0 голосов
/ 23 ноября 2018

Я запускал RandomForestClassifier для набора данных, который я взял из репозитория UCI, который был взят из исследовательской работы.Моя точность составляет ~ 70% по сравнению с 99% статьи (они использовали Random Forrest с WEKA), поэтому я хочу настроить параметры в моем scikit Learn RF, чтобы получить тот же результат (я уже оптимизировал размеры объектов и масштабировал их).Для этого я использую следующий код (random_grid - это просто некоторые жестко запрограммированные значения для различных параметров):

rf = RandomForestClassifier()
# Random search of parameters, using 2 fold cross validation, 
# search across 100 different combinations, and use all available cores
rf_random = RandomizedSearchCV(estimator = rf,  param_distributions = random_grid, n_iter = 100, cv = 2, verbose=2, random_state=42, n_jobs = -1)
# Fit the random search model
rf_random.fit(x_train, x_test)

Когда я пытаюсь запустить этот код, хотя мой питон работает бесконечно (в течение как минимум 40 минут, прежде чем яубил его), не давая никаких результатов.Я пытался максимально уменьшить cv и n_iter, но это все равно не помогает.Я искал везде, чтобы увидеть, есть ли ошибка в моем коде, но не могу ничего найти.Я использую Python 3.6 на Spyder 3.1.2, на дерьмовом ноутбуке с 8Gb RAM и процессором i5.Спасибо за любую помощь!

...