Я продолжаю получать AttributeError в RandomSearchCV - PullRequest
0 голосов
/ 25 июня 2018
x_tu = data_cls_tu.iloc[:,1:].values
y_tu = data_cls_tu.iloc[:,0].values

classifier = DecisionTreeClassifier()
parameters = [{"max_depth": [3,None],
               "min_samples_leaf": np.random.randint(1,9),
               "criterion": ["gini","entropy"]}]
randomcv = RandomizedSearchCV(estimator=classifier, param_distributions=parameters,
                              scoring='accuracy', cv=10, n_jobs=-1,
                              random_state=0)
randomcv.fit(x_tu, y_tu)



---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-17-fa8376cb54b8> in <module>()
     11                               scoring='accuracy', cv=10, n_jobs=-1,
     12                               random_state=0)
---> 13 randomcv.fit(x_tu, y_tu)

~\Anaconda3\lib\site-packages\sklearn\model_selection\_search.py in fit(self, X, y, groups, **fit_params)
    616         n_splits = cv.get_n_splits(X, y, groups)
    617         # Regenerate parameter iterable for each fit
--> 618         candidate_params = list(self._get_param_iterator())
    619         n_candidates = len(candidate_params)
    620         if self.verbose > 0:

~\Anaconda3\lib\site-packages\sklearn\model_selection\_search.py in __iter__(self)
    236         # in this case we want to sample without replacement
    237         all_lists = np.all([not hasattr(v, "rvs")
--> 238                             for v in self.param_distributions.values()])
    239         rnd = check_random_state(self.random_state)
    240 

AttributeError: 'list' object has no attribute 'values'

Привет, я получаю сообщение об ошибке в методе подбора для RandomSearchCV.

Это работало, когда я использовал их в GridSearchCV, но GridSearchCV заняло 5 часов.

x_tu, y_tu имеют тип numpy.ndarray.

1 Ответ

0 голосов
/ 25 июня 2018

param_distributions должен быть dict объектом ( документация ), но вы передаете список, содержащий один dict. Снимите внешние квадратные скобки, тогда они должны нормально работать.

Это должно быть как:

parameters = {"max_depth": [3,None],
               "min_samples_leaf": [np.random.randint(1,9)],
               "criterion": ["gini","entropy"]}
...