Есть ли в Scikit Learn функция эквивалента кареты getmodelinfo ()? - PullRequest
2 голосов
/ 04 марта 2020

Я пытаюсь создать фрейм данных со всеми алгоритмами Scikit Learn, а также метаданными для каждого. В Caret в R есть функция с именем getmodelinfo(), которая делает это.

Есть ли эквивалент в Scikit Learn?

1 Ответ

4 голосов
/ 04 марта 2020

Вы можете получить самые близкие к тому, что вы хотите с sklearn.utils и inspect. Вы можете получить список всех классов sklearn или просто классификаторов, таких как:

from sklearn.utils.testing import all_estimators
all_est = all_estimators(type_filter=None)
all_classifiers = all_estimators(type_filter="classifier")

. Затем с помощью inspect вы можете получить аргументы классификаторов .fit, например:

import inspect
all_classifiers_fit_args = {}
for name, clf in all_classifiers:
    all_classifiers_fit_args[name] = inspect.signature(clf.fit)

Наконец, вы можете поместить информацию в pandas df:

df = pd.DataFrame(all_classifiers_fit_args.items(), columns=["fit_classifier", "args"])
df
    fit_classifier  args
0   AdaBoostClassifier  (self, X, y, sample_weight=None)
1   BaggingClassifier   (self, X, y, sample_weight=None)
2   BernoulliNB (self, X, y, sample_weight=None)
3   CalibratedClassifierCV  (self, X, y, sample_weight=None)
4   CategoricalNB   (self, X, y, sample_weight=None)
5   CheckingClassifier  (self, X, y, **fit_params)
6   ClassifierChain (self, X, Y)
7   ComplementNB    (self, X, y, sample_weight=None)
8   DecisionTreeClassifier  (self, X, y, sample_weight=None, check_input=T...
...

В качестве альтернативы вы можете получить доступ к аргументам самих классификаторов:

for name, clf in all_classifiers:
    all_classifiers_args[name] = inspect.signature(clf)
df = pd.DataFrame(all_classifiers_args.items(), columns=["classifier", "args"])
df
    classifier  args
0   AdaBoostClassifier  (base_estimator=None, n_estimators=50, learnin...
1   BaggingClassifier   (base_estimator=None, n_estimators=10, max_sam...
2   BernoulliNB (alpha=1.0, binarize=0.0, fit_prior=True, clas...
3   CalibratedClassifierCV  (base_estimator=None, method='sigmoid', cv=None)
4   CategoricalNB   (alpha=1.0, fit_prior=True, class_prior=None)
5   CheckingClassifier  (check_y=None, check_X=None, foo_param=0, expe...
6   ClassifierChain (base_estimator, order=None, cv=None, random_s...
7   ComplementNB    (alpha=1.0, fit_prior=True, class_prior=None, ...
8   DecisionTreeClassifier  (criterion='gini', splitter='best', max_depth=...
...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...